过滤至少有 N 行满足掩码条件的组的最佳方法是什么?

问题描述 投票:0回答:1

这是我的数据框:

import pandas as pd
df = pd.DataFrame({
    'a': [10, 20, 30, 50, 50, 50, 4, 100],
    'b': [30, 3, 200, 25, 24, 31, 29, 2],
    'd': list('aaabbbcc')
})

预期输出:

    a    b  d
0  10   30  a
1  20    3  a
2  30  200  a

按列

d
分组。我想返回至少有两个此掩码实例的组

m = (df.b.gt(df.a))

这是我尝试过的。它有效,但我想知道是否有更好/更有效的方法来做到这一点。

out = df.groupby('d').filter(lambda x: len(x.loc[x.b.gt(x.a)]) >= 2)
python pandas dataframe
1个回答
0
投票

您可以在遮罩上使用

groupby.transform
sum
来生成布尔系列:

m = df['b'].gt(df['a'])
out = df[m.groupby(df['d']).transform('sum').ge(2)]

输出:

    a    b  d
0  10   30  a
1  20    3  a
2  30  200  a
© www.soinside.com 2019 - 2024. All rights reserved.