我正在清理数据集,并希望将所有空销售价格替换为该特定邮政编码的平均平均值。
<< img src =“ https://image.soinside.com/eyJ1cmwiOiAiaHR0cHM6Ly9pLmltZ3VyLmNvbS90bW9VQ1IyLnBuZyJ9” alt =“ Imgur”>
我认为首先需要将所有邮政编码及其平均平均销售价格分组
例如
然后用均值替换对应于特定邮政编码的任何空SALESPRICE值
例如
<< img src =“ https://image.soinside.com/eyJ1cmwiOiAiaHR0cHM6Ly9pLmltZ3VyLmNvbS9tTlVHMzdYLnBuZyJ9” alt =“ Imgur”>
如果有人可以帮助我,因为我似乎找不到任何解决方案
这是您可以使用apply解决它的一种方法:
df['SALESPRICE'] = df.apply(lambda x:
x['SALESPRICE'] if pd.notna(x['SALESPRICE'])
else df['SALESPRICE'].loc[df['ZIP CODE']==x['ZIP CODE']].mean(),
axis=1
)
使用groupby.transform
和groupby.transform
:
fillna