我有一个有6列(A-F)和超过200K行的数据帧。我想在列B(名为word)中查找一个字符串,并在另一列D(tf值)中查找其对应的值,请同一行。
例如,我希望输出为:
字:加密,tf:0.009041。
我宁愿不使用循环,但如果需要,我愿意接受建议,因为df很大。非常感谢您的宝贵时间。
可能是我不明白这个问题,但这是你想要的吗?
library(dplyr)
tf <- yourdata %>%
filter(Word == 'encryption') %>%
select(tf)
这将创建一个仅包含列tf的数据框,并且只创建Word的值为“encryption”的行。如果您希望包含Class或Word列中任何一个单词的行,您可以这样做:
library(dplyr)
wordset <- c('hockey','encryption')
tf <- yourdata %>%
filter(Class %in% wordset | Word %in% wordset) %>%
select(tf)