Pandas - groupby和只有4列是相关的

问题描述 投票:0回答:2

我有一个81列的数据框。目前只有四个人对此感兴趣。

它们被称为“传输”(对象),“复合城市MPG”(int64),“复合高速公路MPG”(int64)和“复合组合MPG”(int64)。

我想要每种类型的传输MPG的平均值。

多数民众赞成我尝试过的。

data.groupby(['Transmission'], sort=True).mean()

我如何修复代码,以便只显示相关列的平均值('Composite City MPG'(int64),'Composite Highway MPG'(int64)和'Composite Combined MPG'(int64))?

groupby实际上是寻找每种传输类型的平均MPG的好方法吗?

pandas pandas-groupby
2个回答
0
投票
data.groupby('Transmission' ,\
'Composite City MPG', \
'Composite Highway MPG',\
'Composite Combined MPG')['MPG'].mean()

0
投票

在你的帮助下我改变它以获得我需要的结果。 MPG位于3列'Composite City MPG'(int64),'Composite Highway MPG'(int64)和'Composite Combined MPG'(int64)中。

我用了:

data.groupby('Transmission', sort=True)[['Composite City MPG','Composite Highway MPG','Composite Combined MPG']].mean()

有没有办法使用.isnull()和.notnull()只显示平均值为null或非null的行?我尝试使用apply方法,但结果不是我想要的:

.apply(lambda x: x.notnull())
© www.soinside.com 2019 - 2024. All rights reserved.