所以我有一个 CSV 文件,其中有一个 [] 区打印为列,其中包含数字数据行;我想导出迭代的每一列的平均值。
import pandas as pd
data = pd.read_csv('ny_data.csv')
df = pd.DataFrame(data, columns=["Upper Manhattan", "Inwood", "Harlem"])
df.groupby(["Upper Manhattan", "Inwood", "Harlem"])
resultdata = df.groupby([0])
resultdata =\
({df.groupby["Upper Manhattan"].mean(),
df.groupby["Inwood"].mean(),
df.groupby["Harlem"].mean(),
})
print(resultdata)
我想要每个迭代列的返回输出,该输出提供每列的单个平均值。获得此输出后我不确定的另一个领域是,使用相同的 python 文件创建一个新的 csv 文件,其中仅包含每个迭代列的平均输出。
提前致谢,如果这都是基本的事情,非常抱歉 - 我对编程很陌生,但取得了一些进步哈哈。
要计算 pandas DataFrame 中每列的平均值,可以在 DataFrame 对象上使用
mean()
方法。例如,如果您想获取列的平均值“Upper Manhattan”, “Inwood”, and “Harlem”,
,您可以这样做:
import pandas as pd
data = pd.read_csv('ny_data.csv')
df = pd.DataFrame(data, columns=["Upper Manhattan", "Inwood", "Harlem"])
mean_df = df.mean()
print(mean_df)
结果
Upper Manhattan 123.45
Inwood 234.56
Harlem 345.67
dtype: float64
要将结果保存在新的 csv 文件中,您可以使用
mean_df.to_csv('new_csv.csv')