我想绘制一年中销售额的条形图。 x轴为'year'
,y轴为每年每周销售额的总和。虽然密谋我正在获得'KeyError: 'year'
。我想这是因为'year'
在分组中变成了索引。
以下是csv
文件中的示例内容:
Store year Weekly_Sales
1 2014 24924.5
1 2010 46039.49
1 2015 41595.55
1 2010 19403.54
1 2015 21827.9
1 2010 21043.39
1 2014 22136.64
1 2010 26229.21
1 2014 57258.43
1 2010 42960.91
下面是我用来分组的代码
storeDetail_df = pd.read_csv('Details.csv')
result_group_year= storeDetail_df.groupby(['year'])
total_by_year = result_group_year['Weekly_Sales'].agg([np.sum])
total_by_year.plot(kind='bar' ,x='year',y='sum',rot=0)
更新了代码,下面是输出:DataFrame输出:
year sum
0 2010 42843534.38
1 2011 45349314.40
2 2012 35445927.76
3 2013 0.00
在读取csv
文件时,需要使用空格作为delim_whitespace=True
的分隔符,然后在总结Weekly_Sales
后重置索引。以下是工作代码:
storeDetail_df = pd.read_csv('Details.csv', delim_whitespace=True)
result_group_year= storeDetail_df.groupby(['year'])
total_by_year = result_group_year['Weekly_Sales'].agg([np.sum]).reset_index()
total_by_year.plot(kind='bar' ,x='year',y='sum',rot=0, legend=False)
产量
如果由于逐个命令而使您的索引成为年份。在绘图之前,您需要将其作为索引删除。尝试
total_by_year = total_by_year.reset_index(drop=False, inplace=True)
你可能想试试这个
storeDetail_df = pd.read_csv('Details.csv')
result_group_year= storeDetail_df.groupby(['year'])['Weekly_Sales'].sum()
result_group_year = result_group_year.reset_index(drop=False)
result_group_year.plot.bar(x='year', y='Weekly_Sales')