Pandas groupby() 意思是问题

问题描述 投票:0回答:1

所以我有一个 CSV 文件,其中有一个 [] 区打印为列,其中包含数字数据行;我想导出迭代的每一列的平均值。

import pandas as pd

data = pd.read_csv('ny_data.csv')
df = pd.DataFrame(data, columns=["Upper Manhattan", "Inwood", "Harlem"])

df.groupby(["Upper Manhattan", "Inwood", "Harlem"])
resultdata = df.groupby([0])

resultdata =\
    ({df.groupby["Upper Manhattan"].mean(),
     df.groupby["Inwood"].mean(),
     df.groupby["Harlem"].mean(),
})

print(resultdata)

我想要每个迭代列的返回输出,该输出提供每列的单个平均值。获得此输出后我不确定的另一个领域是,使用相同的 python 文件创建一个新的 csv 文件,其中仅包含每个迭代列的平均输出。

提前致谢,如果这都是基本的事情,非常抱歉 - 我对编程很陌生,但取得了一些进步哈哈。

python pandas csv statistics mean
1个回答
0
投票

要计算 pandas DataFrame 中每列的平均值,可以在 DataFrame 对象上使用

mean()
方法。例如,如果您想获取列的平均值
“Upper Manhattan”, “Inwood”, and “Harlem”,
,您可以这样做:

import pandas as pd

data = pd.read_csv('ny_data.csv')
df = pd.DataFrame(data, columns=["Upper Manhattan", "Inwood", "Harlem"])

mean_df = df.mean()

print(mean_df)

结果

Upper Manhattan    123.45
Inwood             234.56
Harlem             345.67
dtype: float64

要将结果保存在新的 csv 文件中,您可以使用

mean_df.to_csv('new_csv.csv')

© www.soinside.com 2019 - 2024. All rights reserved.