Pandas - groupby和只有4列是相关的

Question

我有一个81列的数据框。目前只有四个人对此感兴趣。

它们被称为“传输”（对象），“复合城市MPG”（int64），“复合高速公路MPG”（int64）和“复合组合MPG”（int64）。

我想要每种类型的传输MPG的平均值。

多数民众赞成我尝试过的。

data.groupby(['Transmission'], sort=True).mean()

我如何修复代码，以便只显示相关列的平均值（'Composite City MPG'（int64），'Composite Highway MPG'（int64）和'Composite Combined MPG'（int64））？

groupby实际上是寻找每种传输类型的平均MPG的好方法吗？

Answer 1

data.groupby('Transmission' ,\
'Composite City MPG', \
'Composite Highway MPG',\
'Composite Combined MPG')['MPG'].mean()

Answer 2

在你的帮助下我改变它以获得我需要的结果。 MPG位于3列'Composite City MPG'（int64），'Composite Highway MPG'（int64）和'Composite Combined MPG'（int64）中。

我用了：

data.groupby('Transmission', sort=True)[['Composite City MPG','Composite Highway MPG','Composite Combined MPG']].mean()

有没有办法使用.isnull（）和.notnull（）只显示平均值为null或非null的行？我尝试使用apply方法，但结果不是我想要的：

.apply(lambda x: x.notnull())