如何创建一个美丽的群体变量，该变量将允许find_all识别htmltable

Question

我正在尝试根据五个网站页面创建一个单一的内容变量。我正在使用的代码是：

soup_a = []
for i in range(1,6):
    url_a = f'https://www.mascotdb.com/native-american-high-school?page={i}'
    resp_a = requests.get(url_a, headers=headers)
    soup_a.append(bs(resp_a.content, "html.parser"))

这获取了我的信息，但是我想使用BS将所有HTML表组合为一个可以从中提取数据的变量。我正在使用的代码ISL

main_table_a = soup_a.find_all("table", {"class":"table table-striped views-table views-view-table cols-5"})

这给我一个错误的“列表'对象没有属性'find_all'”的错误。我假设我的错误在于我如何设置soup_a。有更好的方法可以解决吗？

Answer 1

已经由约翰·戈登（John Gordon）正确评论了，该列表没有该方法

find_all()

即使这里的问题含糊不清，主要的重点似乎是在网页上刮擦表并将其显示为一个。这可以在美丽的套件的帮助下实现，但我更喜欢刮擦桌子。

如果您想使用该范围，它应该从0开始，否则您会跳过表格的第一页，并在结果中错过它。 pandas.read_html()

结果是一个数据框，然后您也可以将其转移到任何其他格式（dict，...）

客体名称

Mascot城 Status0''iolani -honoluluhawaii1a.h。帕克贝森阿拉巴马 2 Abercrombie北达科他州佛罗里达齐翁学院 chiefs Bradenton2997佐伊·克里斯蒂安米奇根 thundbirdszuni新墨西哥活动

州					raiders
活动				Birmingham	活动
Abercrombie	arrows		解密		...
					2996
florida	活动			Warriors	Warren
解密		2998	zuni

如何创建一个美丽的群体变量，该变量将允许find_all识别htmltable

问题描述投票：0回答：1

1个回答

最新问题

如何创建一个美丽的群体变量，该变量将允许find_all识别htmltable

问题描述 投票：0回答：1

1个回答

最新问题

问题描述投票：0回答：1