将因子级别更改为列的自定义顺序

问题描述 投票:1回答:2

我有一个如下数据框

> data = data.frame(name = c('Mike', 'Tony', 'Carol', 'Tim', 'Joe'), veh = c('car', 'bike', 'car', 'car', 'cycle') )
> data
   name   veh
1  Mike   car
2  Tony  bike
3 Carol   car
4   Tim   car
5   Joe cycle
> str(data$name)
 Factor w/ 5 levels "Carol","Joe",..: 3 5 1 4 2
> str(data$veh)
 Factor w/ 3 levels "bike","car","cycle": 2 1 2 2 3
> levels(data$veh)
[1] "bike"  "car"   "cycle"

默认情况下,因子级别设置为1表示自行车,2表示汽车,3表示循环。我需要将因子水平改为1为汽车,2为循环,3为自行车 - 我该如何解决这个问题?

r dataframe
2个回答
1
投票

tidyverse / forcats解决方案没有错,但base-R解决方案是使用factor()和所需顺序指定的levels参数:

data$veh <- factor(data$veh, levels=c("car","cycle","bike"))

与普遍看法相反,ordered=TRUE在这种情况下通常不是必需的(即使普通因子也有排序),除非您特别希望将焦点变量视为序数变量(在这种情况下,R将使用正交多项式对比,而不是处理对比,默认情况下),或者希望能够在变量上使用比较运算符(例如veh > "car");如果您不确定,默认(普通)因素可能很好。


2
投票

我们可以使用fct_relevel

library(forcats)
data$veh <- fct_relevel(data$veh, c('car', 'cycle', 'bike'))
str(data$veh)
#Factor w/ 3 levels "car","cycle",..: 1 3 1 1 2
最新问题
© www.soinside.com 2019 - 2024. All rights reserved.