如何重新编码三级因子

问题描述 投票:0回答:2

我的数据集是一个包含有关各个子项的信息的数据集。我有一个复杂的因素问题。我有两个变量:父级1财务和父级2财务(采用三个值之一:低,中,高收入)。我想提出第三个变量,“监护人财务”,因为我的某些科目只有一个父母。我该如何对其进行重新编码,以便选择最高的财务水平,并且如果孩子来自一个单亲家庭,则将其结转到新的“监护人”变量。

       p1        n
      <int>    <int>
1      low     100
2      medium  306
3      high    96
        p2            n
       <int>       <int>
1      low         227
2      medium      230
3      high        243
r database factors
2个回答
0
投票

[如果要在两个数据集中获得最高的'n',请在'p'列之间进行两列的联接,然后使用pmax返回'n'列之间的max] >

library(dplyr)
inner_join(df1, df2, by = c("p1" = "p2") %>%
     mutate(n = pmax(n.x, n.y) %>%
     select(p1, n)

0
投票

我使用时

最新问题
© www.soinside.com 2019 - 2025. All rights reserved.