我可以对此大型excel文件数据集进行哪种分析?

问题描述 投票:0回答:1

我在一家向顾客出售提桶的公司工作。我正在为一个班级项目这样做,但是在Python方面我并不是最好的。该文件列出了从2015年到2019年购买了不同类型桶的数千名客户。我的财务部想知道谁归还他们,不归还他们,返还率是多少?

我设法使用python只使用了与我的分析相关的选定列(see this data)。导出到csv文件后,应该在Python中运行哪种分析以帮助回答我的问题?我已经做过数据透视表和图表(以计算有多少客户退货桶和年份),但是我想使用Python使事情更易于阅读和分析,以便我可以回答问题。

import pandas as pd

data = pd.read_excel (r'C:\Users\Vilma\Documents\CIS450\Inidividual project\ContainerTracker.xlsx',
sheet_name='2015-2019') 
df = pd.DataFrame(data, columns= ['Customer for Tracking::CustomerName',
          'Customer for Tracking::CustomerID',
          'Order for Tracking::OrderDate',
          'Products for Tracking::ProdName',
          'Transaction Items for Tracking::Description',
          'RemovalNote',
          'RemovalDate',
          'OrderID'])


df.to_csv(r'C:\Users\Vilma\Documents\CIS450\Inidividual project\ContainerTrackerTrimmed.csv',index = False)
print (df)
python excel pandas pivot-table analytics
1个回答
0
投票

[请阅读我有关发布可复制问题的评论,并提供示例,我们可能会复制并粘贴这些示例,并继续为您提供解决方案。

话虽如此,但如果我对您的理解正确,我相信.groupby()功能可能会有助于您解决问题:

# fill your black entries with something like No Return

df = df[df['RemovalNote'] == ''] = 'No Return' # fill empty rows

df1 = df.groupby('Customer for Tracking::CustomerName')['RemovalNote'].value_counts()

print(df1)

我希望这会有所帮助,即使您的问题非常模棱两可。

最新问题
© www.soinside.com 2019 - 2025. All rights reserved.