如何过滤数据框以仅显示跨多个列的重复行?
示例数据帧:
col1 col2 col3
A1 B1 C1
A1 B1 C1
A1 B1 C2
A2 B2 C2
预期产量:
col1 col2 col3
A1 B1 C1
A1 B1 C1
我的尝试:
df[df.duplicated(['col1', 'col2', 'col3'], keep=False)]
但这并没有给出预期的结果。
你的尝试df[df.duplicated(['col1', 'col2', 'col3'], keep=False)]
在我的测试中起作用。您可以省略列名称:
df[df.duplicated(keep=False)]