full_join由变量作为列名

问题描述 投票:3回答:4

我正在尝试使用dplyr的full_join来组合两个data.frames,例如:

col1 = 'b'
col2 = 'd'

df1 = data.frame(a = 1:3, b = 1:3)
df2 = data.frame(a = 1:3, d = 1:3)


full_join(df1, df2, c('a' = 'a', col1 = col2))

但它回来了

错误:by不能包含LHS中缺少的连接列col1

我正在寻找类似的输出

merge(df1, df2, by.x = c('a', col1), by.y = c('a', col2))
  a b
1 1 1
2 2 2
3 3 3
r dplyr
4个回答
4
投票

你可以使用rename_,即

library(dplyr)

full_join(df1, rename_(df2, .dots = setNames(col2, col1)))

这使,

#Joining, by = c("a", "b")
  a b
1 1 1
2 2 2
3 3 3

根据@akrun和@ mt1022评论发布备选方案,

#akrun
full_join(df1, rename_at(df2, .vars = col2, funs(paste0(col1))))
full_join(df1, rename(df2, !!(col1) := !!rlang::sym(col2)))

#mt1022
full_join(df1, rename_at(df2, col2, ~col1))

1
投票

像这样更改连接:

full_join(df1, df2, by=c('b'='d'))  
a.x b a.y
1   1 1   1
2   2 2   2
3   3 3   3

1
投票

duplicate link中对@MrFlick的所有学分,稍微修改为OP的例子:

full_join(df1, df2, by = c("a",setNames(col2, col1)))

0
投票

这会重现你的结果,这是你想要的吗?

full_join(df1, df2, by="a")%>%select(-d)
© www.soinside.com 2019 - 2024. All rights reserved.