我正在尝试根据五个网站页面创建一个单一的内容变量。我正在使用的代码是:
soup_a = []
for i in range(1,6):
url_a = f'https://www.mascotdb.com/native-american-high-school?page={i}'
resp_a = requests.get(url_a, headers=headers)
soup_a.append(bs(resp_a.content, "html.parser"))
这获取了我的信息,但是我想使用BS将所有HTML表组合为一个可以从中提取数据的变量。 我正在使用的代码ISL
main_table_a = soup_a.find_all("table", {"class":"table table-striped views-table views-view-table cols-5"})
这给我一个错误的“列表'对象没有属性'find_all'”的错误。 我假设我的错误在于我如何设置soup_a。 有更好的方法可以解决吗?
find_all()
如果您想使用该范围,它应该从0开始,否则您会跳过表格的第一页,并在结果中错过它。
pandas.read_html()
客体名称
州 | raiders | ||||
---|---|---|---|---|---|
活动 | Birmingham | 活动 | |||
Abercrombie | arrows | 解密 | ... | ||
2996 | |||||
florida | 活动 | Warriors | Warren | ||
解密 | 2998 | zuni | |||