我正在尝试使用BeautifulSoup刮掉这个网页https://www.whoscored.com/Statistics,以获取播放器统计表的所有信息。我遇到了很多困难,并且想知道是否有人能够帮助我。
url = 'https://www.whoscored.com/Statistics'
html = requests.get(url).content
soup = BeautifulSoup(html, "lxml")
text = [element.text for element in soup.find_all('div' {'id':"statistics-table-summary"})]
我的问题在于我不知道获取该表的正确标签是什么。该表有几页,我想刮掉每一页。我在表中看到的页面更改的唯一指示是下面代码中的数字:
<div id="statistics-table-summary" class="" data-fwsc="11">