有没有人知道在Python / Pandas中基于两个数据帧创建新数据帧的有效方法?
我要做的是检查df1中的值是否在df2中,然后不要将行添加到df3。我正在使用学生IDS,如果来自df1的学生ID在df2中,我不想将其包含在新数据框df3中。
那么有人知道这样做的有效方法吗?我用google搜索并查看了SO,但到目前为止找不到任何有用的东西。
假设该列被称为ID。
df3 = df1[~df1["ID"].isin(df2["ID"])].copy()
如果您有两个相同长度的数据帧,您还可以使用:
print df1.loc [df1 ['ID']!= df2 ['ID']]
将其分配给第三个数据帧。