如何创建一个美丽的群体变量,该变量将允许find_all识别htmltable

问题描述 投票:0回答:1

我正在尝试根据五个网站页面创建一个单一的内容变量。我正在使用的代码是:

soup_a = []
for i in range(1,6):
    url_a = f'https://www.mascotdb.com/native-american-high-school?page={i}'
    resp_a = requests.get(url_a, headers=headers)
    soup_a.append(bs(resp_a.content, "html.parser"))

这获取了我的信息,但是我想使用BS将所有HTML表组合为一个可以从中提取数据的变量。 我正在使用的代码ISL

main_table_a = soup_a.find_all("table", {"class":"table table-striped views-table views-view-table cols-5"})

这给我一个错误的“列表'对象没有属性'find_all'”的错误。 我假设我的错误在于我如何设置soup_a。 有更好的方法可以解决吗?

python beautifulsoup
1个回答
0
投票
已经由约翰·戈登(John Gordon)正确评论了,该列表没有该方法

find_all()


即使这里的问题含糊不清,主要的重点似乎是在网页上刮擦表并将其显示为一个。这可以在美丽的套件的帮助下实现,但我更喜欢刮擦桌子。

如果您想使用该范围,它应该从0开始,否则您会跳过表格的第一页,并在结果中错过它。 pandas.read_html()

结果是一个数据框,然后您也可以将其转移到任何其他格式(dict,...)

客体名称
Mascot城 Status0''iolani -honoluluhawaii1a.h。帕克贝森 阿拉巴马 2 Abercrombie北达科他州 佛罗里达齐翁学院 chiefs Bradenton2997佐伊·克里斯蒂安 米奇根 thundbirdszuni新墨西哥 活动
raiders
活动 Birmingham活动
Abercrombie arrows 解密 ...
2996
florida 活动 Warriors Warren
解密 2998 zuni
最新问题
© www.soinside.com 2019 - 2025. All rights reserved.