我有一个81列的数据框。目前只有四个人对此感兴趣。
它们被称为“传输”(对象),“复合城市MPG”(int64),“复合高速公路MPG”(int64)和“复合组合MPG”(int64)。
我想要每种类型的传输MPG的平均值。
多数民众赞成我尝试过的。
data.groupby(['Transmission'], sort=True).mean()
我如何修复代码,以便只显示相关列的平均值('Composite City MPG'(int64),'Composite Highway MPG'(int64)和'Composite Combined MPG'(int64))?
groupby实际上是寻找每种传输类型的平均MPG的好方法吗?
data.groupby('Transmission' ,\
'Composite City MPG', \
'Composite Highway MPG',\
'Composite Combined MPG')['MPG'].mean()
在你的帮助下我改变它以获得我需要的结果。 MPG位于3列'Composite City MPG'(int64),'Composite Highway MPG'(int64)和'Composite Combined MPG'(int64)中。
我用了:
data.groupby('Transmission', sort=True)[['Composite City MPG','Composite Highway MPG','Composite Combined MPG']].mean()
有没有办法使用.isnull()和.notnull()只显示平均值为null或非null的行?我尝试使用apply方法,但结果不是我想要的:
.apply(lambda x: x.notnull())