我的日期框架具有以下结构:
df = pd.DataFrame({'GROUP_ID': np.random.randint(1, 7, size=100),
'VALUES': np.random.randint(0, 50, size=100)})
df['THRESHOLD'] = df['GROUP_ID']*5
df = df[['GROUP_ID','VALUES','THRESHOLD']]
df.sort_values(by='GROUP_ID', inplace=True)
(这只是例如)
列THRESHOLD实际上是每个组的百分位数(以%为单位)。我需要添加一个列'PERCENTILE',每个组中的值应该有百分位数的数值。
我试图使用groupby
和apply
,但我不知道如何将qRESxswpoi函数中的THRESHOLD列的值传递给参数q
。
使用qazxsw poi为qazxsw poi创建字典和地图阈值,传递给函数qazxsw poi,使用quantile\percentile
创建新列,只需要0到1之间的必要阈值:
x.name