请帮助,我可以对这种大型excel文件数据集进行哪种分析?

问题描述 投票:0回答:1

我在一家向顾客出售提桶的公司工作。我正在为一个班级项目这样做,但在python方面我并不是最好的。该文件列出了从2015年到2019年购买了不同类型桶的数千名客户。财务部想知道谁归还他们,哪些人不归,以什么比率归还?我设法使用python只使用选定的列(*请参见下面的代码[在此处输入图像描述] [1]),与我的分析有关。一旦我导出到csv文件,应该在python中运行哪种分析以帮助回答我的问题?我已经做过数据透视表和图表(以计算有多少客户退还桶和年份),但是想使用python使事情更易于阅读和分析,因此我可以回答这个问题。请对此提供任何帮助,谢谢!

import pandas as pd

data = pd.read_excel (r'C:\Users\Vilma\Documents\CIS450\Inidividual project\ContainerTracker.xlsx',
sheet_name='2015-2019') 
df = pd.DataFrame(data, columns= ['Customer for Tracking::CustomerName',
          'Customer for Tracking::CustomerID',
          'Order for Tracking::OrderDate',
          'Products for Tracking::ProdName',
          'Transaction Items for Tracking::Description',
          'RemovalNote',
          'RemovalDate',
          'OrderID'])


df.to_csv(r'C:\Users\Vilma\Documents\CIS450\Inidividual project\ContainerTrackerTrimmed.csv',index = False)
print (df)


  [1]: https://i.stack.imgur.com/gBwTA.png
python excel pandas pivot-table analytics
1个回答
0
投票

[请阅读我有关发布可复制问题的评论,并提供示例,我们可能会复制并粘贴这些示例,并继续为您提供解决方案。

话虽如此,但如果我对您的理解正确,我相信.groupby()功能可能会有助于您解决问题:

# fill your black entries with something like No Return

df = df[df['RemovalNote'] == ''] = 'No Return' # fill empty rows

df1 = df.groupby('Customer for Tracking::CustomerName')['RemovalNote'].value_counts()

print(df1)

我希望这会有所帮助,即使您的问题非常模棱两可。

最新问题
© www.soinside.com 2019 - 2025. All rights reserved.