R语言第二章数据处理⑤数据框列的转化和计算目录正文

正文

本篇描述了如何计算R中的数据框并将其添加到数据框中。一般使用dplyr R包中以下R函数:

Mutate():计算新变量并将其添加到数据表中。 它保留了现有的变量。 Transmutate():计算新列但删除现有变量。 同时还有mutate()和transmutate()的三个变体来一次修改多个列: Mutate_all()/ transmutate_all():将函数应用于数据框中的每个列。 Mutate_at()/ transmutate_at():将函数应用于使用字符向量选择的特定列 Mutate_if()/ transmutate_if():将函数应用于使用返回TRUE的谓词函数选择的列

  • mutate:通过保留现有变量来添加新变量,通过保留现有列来添加新列(sepal_by_petal):
代码语言:javascript
复制
library(tidyverse)
my_data <- as_tibble(iris)
my_data
my_data %>% 
  mutate(sepal_by_petal_l = Sepal.Length/Petal.Length)
  • transmute:通过删除现有变量来创建新变量,删除现有列,添加新列(sepal_by_petal):
代码语言:javascript
复制
my_data %>%
  transmute(
    sepal_by_petal_l = Sepal.Length/Petal.Length,
    sepal_by_petal_w = Sepal.Width/Petal.Width
    )
  • 一次修改多个列

函数mutate_all()/ transmutate_all(),mutate_at()/ transmutate_at()和mutate_if()/ transmutate_if()可用于一次修改多个列。

简化格式如下:

代码语言:javascript
复制
# Mutate variants
mutate_all(.tbl, .funs, ...)
mutate_if(.tbl, .predicate, .funs, ...)
mutate_at(.tbl, .vars, .funs, ...)

Transmutate variants

transmute_all(.tbl, .funs, ...)
transmute_if(.tbl, .predicate, .funs, ...)
transmute_at(.tbl, .vars, .funs, ...)

tbl:一个tbl数据框
funs:由funs()生成的函数调用列表,或函数名称的字符向量,或简称为函数。predicate:要应用于列或逻辑向量的谓词函数。 选择predicate为或返回TRUE的变量。

  • 转换特定列

mutate_at():转换按名称选择的特定列:

代码语言:javascript
复制
my_data2 %>%
  mutate_at(
    c("Sepal.Length", "Petal.Width"),
    funs(cm = ./2.54)
    )
  • mutate_if():转换由谓词函数选择的特定列。
  • mutate_if()对于将变量从一种类型转换为另一种类型特别有用。
代码语言:javascript
复制
# 将所有因子列转化成字符
my_data %>% mutate_if(is.factor, as.character)
# 将左右数字列四舍五入
my_data %>% mutate_if(is.numeric, round, digits = 0)