我可以对此大型excel文件数据集进行哪种分析？

Question

我在一家向顾客出售提桶的公司工作。我正在为一个班级项目这样做，但是在Python方面我并不是最好的。该文件列出了从2015年到2019年购买了不同类型桶的数千名客户。我的财务部想知道谁归还他们，不归还他们，返还率是多少？

我设法使用python只使用了与我的分析相关的选定列（see this data）。导出到csv文件后，应该在Python中运行哪种分析以帮助回答我的问题？我已经做过数据透视表和图表（以计算有多少客户退货桶和年份），但是我想使用Python使事情更易于阅读和分析，以便我可以回答问题。

import pandas as pd

data = pd.read_excel (r'C:\Users\Vilma\Documents\CIS450\Inidividual project\ContainerTracker.xlsx',
sheet_name='2015-2019') 
df = pd.DataFrame(data, columns= ['Customer for Tracking::CustomerName',
          'Customer for Tracking::CustomerID',
          'Order for Tracking::OrderDate',
          'Products for Tracking::ProdName',
          'Transaction Items for Tracking::Description',
          'RemovalNote',
          'RemovalDate',
          'OrderID'])


df.to_csv(r'C:\Users\Vilma\Documents\CIS450\Inidividual project\ContainerTrackerTrimmed.csv',index = False)
print (df)

Answer 1

[请阅读我有关发布可复制问题的评论，并提供示例，我们可能会复制并粘贴这些示例，并继续为您提供解决方案。

话虽如此，但如果我对您的理解正确，我相信.groupby()功能可能会有助于您解决问题：

# fill your black entries with something like No Return

df = df[df['RemovalNote'] == ''] = 'No Return' # fill empty rows

df1 = df.groupby('Customer for Tracking::CustomerName')['RemovalNote'].value_counts()

print(df1)

我希望这会有所帮助，即使您的问题非常模棱两可。

我可以对此大型excel文件数据集进行哪种分析？

问题描述投票：0回答：1

1个回答

最新问题

我可以对此大型excel文件数据集进行哪种分析？

问题描述 投票：0回答：1

1个回答

最新问题

问题描述投票：0回答：1