ethnicity_col_names <- c("surname", "first_name", "surname.match", "white", "black",
"hispanic", "asian", "other")
colnames(ethnicity_sample) <- ethnicity_col_names
ethnicity_sample$try <- pmax(ethnicity_sample$white, ethnicity_sample$black, ethnicity_sample$hispanic,
ethnicity_sample$asian, ethnicity_sample$other)
每个种族类别都会返回该种族所属人士的百分比可能性。当我使用pmax函数时,它返回最高的%(以数字表示)。我希望它返回匹配度最高的种族的列的名称。
我是R的新手,希望得到一些帮助
我们可以使用max.col
返回每一行具有最大值的列的索引
names(df1)[max.col(df1[nm1], 'first')]