这是我的数据框:
import pandas as pd
df = pd.DataFrame({
'a': [10, 20, 30, 50, 50, 50, 4, 100],
'b': [30, 3, 200, 25, 24, 31, 29, 2],
'd': list('aaabbbcc')
})
预期输出:
a b d
0 10 30 a
1 20 3 a
2 30 200 a
按列
d
分组。我想返回至少有两个此掩码实例的组
m = (df.b.gt(df.a))
这是我尝试过的。它有效,但我想知道是否有更好/更有效的方法来做到这一点。
out = df.groupby('d').filter(lambda x: len(x.loc[x.b.gt(x.a)]) >= 2)
groupby.transform
和 sum
来生成布尔系列:
m = df['b'].gt(df['a'])
out = df[m.groupby(df['d']).transform('sum').ge(2)]
输出:
a b d
0 10 30 a
1 20 3 a
2 30 200 a