将函数汇总到数据框，同时在熊猫中保留行

Question

我想基于一个称为COLLISION_ID的字段以及每个COLLISION_ID的计数来汇总我的数据。

（我想删除重复的COLLISION_ID，因为它们具有相同的坐标，但是保留了原始数据集中的出现次数。]

我的代码在下面

df2 = df1.groupby（['COLLISION_ID']）[['COLLISION_ID']]。count（）

这将返回：

我希望将我的数据作为COLLISION_ID号，计数和数据的其余列返回，这些未在此处显示（〜40个其他列，稍后将进行过滤）

Answer 1

如果您正在谈论过滤器，我们应该做transform

df1['count_col']=df1.groupby(['COLLISION_ID'])['COLLISION_ID'].transform('count')

然后您可以使用列数过滤df1