映射pandas数据帧中的列

问题描述 投票:1回答:2

我正在尝试根据另一个数据帧在数据框中映射2列。

第一个数据帧df1具有以下结构:

   ID1   ID2 check_ID
1 jason becky 1
2 becky tina  1
3 becky joe   1
4 jason joe   2
5 jason becky 2

第二个数据帧df2具有以下结构:

   ID check_ID answer
1 jason   1       yes
2 becky   1       yes
3 tina    1       no
4 joe     1       yes
5 jason   2       no
6 joe     2       no
7 becky   2       no

我正在寻找的输出是:

   ID1   ID2 check_ID answer_ID1 answer_ID2
1 jason becky 1           yes       yes
2 becky tina  1           yes       no
3 becky joe   1           yes       yes
4 jason joe   2           no        no
5 jason becky 2           no        no

因此,answer_ID1对应于df2中的ID1和check_ID,同样,answer_ID2对应于ID2和check_ID。

这样做的最佳方式是什么?我不太明白地图和申请之间的区别,或者我是否应该更换..

提前致谢

python pandas
2个回答
1
投票

您可以在dataframe列上使用内部联接合并

df.merge(df1,left_on=['ID1','check_ID'],right_on=['ID','check_ID'],how='inner')

**编辑**

df.merge(df1.rename(columns={'ID':'ID1'}),left_on=['ID1','check_ID'],right_on=['ID1','check_ID'],how='inner')

日期:

        ID1         ID2 check_ID    answer
0      jason        becky   1   yes
1       becky       tina    1   yes
2       becky       joe     1   yes
3       jason       joe     2   no
4       jason       becky   2   no

0
投票

你必须像这样加入他们

df1.set_index('key').join(df2.set_index('key'))

df1中的密钥表示ID1,密钥表示df2存在ID

© www.soinside.com 2019 - 2024. All rights reserved.