根据某些列标准合并几乎重复的行

问题描述 投票:0回答:0

我有一个 pandas 数据框,其中有几行彼此几乎重复,除了一个值。我的目标是将这些行合并成一行,而不对数值求和。

这是我正在使用的示例: |名称|文本|值1| |-|-|-| |A|抗体|2| |A|Abc|0| |A|Abcd|2| |B|A|0| |B|Ab|2|

我想要一个具有唯一“名称”(名称列)的新数据框,但包含以下信息:

  • “Value1”列的串联
  • Criteria1:Value1_concat 中等于 2 的值的数量
  • Text_Criteria1:符合 Criteria1 的文本(Value1 == 2 的文本)
  • 总计:Value1_concat 列表中值的总数(意味着 A 有 3 个,B 有 2 个)
姓名 Value1_concat 标准1 Text_Criteria1 总计
A [2,0,2] 2 “Ab. Abcd” 3
[0,2] 1 “抗体。” 2

解决这个问题的最佳方法是什么?我已经研究过 groupby() 函数,但我仍然不太了解它。

python pandas dataframe merge aggregate
© www.soinside.com 2019 - 2024. All rights reserved.