我想基于一个称为COLLISION_ID的字段以及每个COLLISION_ID的计数来汇总我的数据。
(我想删除重复的COLLISION_ID,因为它们具有相同的坐标,但是保留了原始数据集中的出现次数。]
我的代码在下面
df2 = df1.groupby(['COLLISION_ID'])[['COLLISION_ID']]。count()
我希望将我的数据作为COLLISION_ID号,计数和数据的其余列返回,这些未在此处显示(〜40个其他列,稍后将进行过滤)
如果您正在谈论过滤器,我们应该做transform
df1['count_col']=df1.groupby(['COLLISION_ID'])['COLLISION_ID'].transform('count')
然后您可以使用列数过滤df1