我在一家向顾客出售提桶的公司工作。我正在为一个班级项目这样做,但是在Python方面我并不是最好的。该文件列出了从2015年到2019年购买了不同类型桶的数千名客户。我的财务部想知道谁归还他们,不归还他们,返还率是多少?
我设法使用python只使用了与我的分析相关的选定列(see this data)。导出到csv文件后,应该在Python中运行哪种分析以帮助回答我的问题?我已经做过数据透视表和图表(以计算有多少客户退货桶和年份),但是我想使用Python使事情更易于阅读和分析,以便我可以回答问题。
import pandas as pd
data = pd.read_excel (r'C:\Users\Vilma\Documents\CIS450\Inidividual project\ContainerTracker.xlsx',
sheet_name='2015-2019')
df = pd.DataFrame(data, columns= ['Customer for Tracking::CustomerName',
'Customer for Tracking::CustomerID',
'Order for Tracking::OrderDate',
'Products for Tracking::ProdName',
'Transaction Items for Tracking::Description',
'RemovalNote',
'RemovalDate',
'OrderID'])
df.to_csv(r'C:\Users\Vilma\Documents\CIS450\Inidividual project\ContainerTrackerTrimmed.csv',index = False)
print (df)
[请阅读我有关发布可复制问题的评论,并提供示例,我们可能会复制并粘贴这些示例,并继续为您提供解决方案。
话虽如此,但如果我对您的理解正确,我相信.groupby()
功能可能会有助于您解决问题:
# fill your black entries with something like No Return
df = df[df['RemovalNote'] == ''] = 'No Return' # fill empty rows
df1 = df.groupby('Customer for Tracking::CustomerName')['RemovalNote'].value_counts()
print(df1)
我希望这会有所帮助,即使您的问题非常模棱两可。