我有一个如下数据框
> data = data.frame(name = c('Mike', 'Tony', 'Carol', 'Tim', 'Joe'), veh = c('car', 'bike', 'car', 'car', 'cycle') )
> data
name veh
1 Mike car
2 Tony bike
3 Carol car
4 Tim car
5 Joe cycle
> str(data$name)
Factor w/ 5 levels "Carol","Joe",..: 3 5 1 4 2
> str(data$veh)
Factor w/ 3 levels "bike","car","cycle": 2 1 2 2 3
> levels(data$veh)
[1] "bike" "car" "cycle"
默认情况下,因子级别设置为1表示自行车,2表示汽车,3表示循环。我需要将因子水平改为1为汽车,2为循环,3为自行车 - 我该如何解决这个问题?
tidyverse / forcats
解决方案没有错,但base-R解决方案是使用factor()
和所需顺序指定的levels
参数:
data$veh <- factor(data$veh, levels=c("car","cycle","bike"))
与普遍看法相反,ordered=TRUE
在这种情况下通常不是必需的(即使普通因子也有排序),除非您特别希望将焦点变量视为序数变量(在这种情况下,R将使用正交多项式对比,而不是处理对比,默认情况下),或者希望能够在变量上使用比较运算符(例如veh > "car"
);如果您不确定,默认(普通)因素可能很好。
我们可以使用fct_relevel
library(forcats)
data$veh <- fct_relevel(data$veh, c('car', 'cycle', 'bike'))
str(data$veh)
#Factor w/ 3 levels "car","cycle",..: 1 3 1 1 2