我有一个名为IPL Data Set的matches.csv
,我是从Kaggle取得的,我试图找出最大匹配数量的地方。
下面的代码给出了正确的比赛数量值,但我想查看最大比赛数量的体育场名称。
matches['venue'].value_counts().max()
这给了我66
预期产出如下:
M Chinnaswamy Stadium 66
如果可能的话,我想获得在该体育场内进行的最后一场比赛的所有细节。
以下是数据帧的负责人:
id season city date team1 team2 toss_winner toss_decision result dl_applied winner win_by_runs win_by_wickets player_of_match venue umpire1 umpire2 umpire3
0 1 2017 Hyderabad 2017-04-05 Sunrisers Hyderabad Royal Challengers Bangalore Royal Challengers Bangalore field normal 0 Sunrisers Hyderabad 35 0 Yuvraj Singh Rajiv Gandhi International Stadium, Uppal AY Dandekar NJ Llong NaN
1 2 2017 Pune 2017-04-06 Mumbai Indians Rising Pune Supergiant Rising Pune Supergiant field normal 0 Rising Pune Supergiant 0 7 SPD Smith Maharashtra Cricket Association Stadium A Nand Kishore S Ravi NaN
2 3 2017 Rajkot 2017-04-07 Gujarat Lions Kolkata Knight Riders Kolkata Knight Riders field normal 0 Kolkata Knight Riders 0 10 CA Lynn Saurashtra Cricket Association Stadium Nitin Menon CK Nandan NaN
找出最大匹配数的位置
>>matches['venue'].value_counts().head(1)
M Chinnaswamy Stadium 66
请注意,value_counts
已经以递减的方式对数据进行排序,因此第一条记录始终是最大值。
获取该体育场内最后一场比赛的所有细节。
>>matches[matches['venue']=='M Chinnaswamy Stadium'].sort_values('date',ascending=False).head(1)
id season city date team1 team2 toss_winner toss_decision result dl_applied winner win_by_runs win_by_wickets player_of_match venue umpire1 umpire2 umpire3
57 58 2017 Bangalore 2017-05-19 Kolkata Knight Riders Mumbai Indians Mumbai Indians field normal 0 Mumbai Indians 0 6 KV Sharma M Chinnaswamy Stadium NJ Llong Nitin Menon NaN
在这里,您可以通过查询地点名称来制作数据帧的切片,然后在日期列中输入sort_values
并获取第一个结果,这将为您提供最新的匹配详细信息。
注意我使用了最新的kaggle数据集。值可能已更改,但解决方案保持不变。
希望这可以帮助。
将ascending=False
移动到新变量,然后您可以提取该数据的子集。
value_counts()
如果可能的话,我想获得在该体育场内进行的最后一场比赛的所有细节。
为此,您需要发布数据集的样本。