我在一家向顾客出售提桶的公司工作。我正在为一个班级项目这样做,但在python方面我并不是最好的。该文件列出了从2015年到2019年购买了不同类型桶的数千名客户。财务部想知道谁归还他们,哪些人不归,以什么比率归还?我设法使用python只使用选定的列(*请参见下面的代码[在此处输入图像描述] [1]),与我的分析有关。一旦我导出到csv文件,应该在python中运行哪种分析以帮助回答我的问题?我已经做过数据透视表和图表(以计算有多少客户退还桶和年份),但是想使用python使事情更易于阅读和分析,因此我可以回答这个问题。请对此提供任何帮助,谢谢!
import pandas as pd
data = pd.read_excel (r'C:\Users\Vilma\Documents\CIS450\Inidividual project\ContainerTracker.xlsx',
sheet_name='2015-2019')
df = pd.DataFrame(data, columns= ['Customer for Tracking::CustomerName',
'Customer for Tracking::CustomerID',
'Order for Tracking::OrderDate',
'Products for Tracking::ProdName',
'Transaction Items for Tracking::Description',
'RemovalNote',
'RemovalDate',
'OrderID'])
df.to_csv(r'C:\Users\Vilma\Documents\CIS450\Inidividual project\ContainerTrackerTrimmed.csv',index = False)
print (df)
[1]: https://i.stack.imgur.com/gBwTA.png
[请阅读我有关发布可复制问题的评论,并提供示例,我们可能会复制并粘贴这些示例,并继续为您提供解决方案。
话虽如此,但如果我对您的理解正确,我相信.groupby()
功能可能会有助于您解决问题:
# fill your black entries with something like No Return
df = df[df['RemovalNote'] == ''] = 'No Return' # fill empty rows
df1 = df.groupby('Customer for Tracking::CustomerName')['RemovalNote'].value_counts()
print(df1)
我希望这会有所帮助,即使您的问题非常模棱两可。