从多个URLS

问题描述 投票:0回答:1

我正在尝试根据五个网站页面创建一个单一的内容变量。 我正在使用的代码是
for i in range(1,6):
    url_a = f'https://www.mascotdb.com/native-american-high-school?page={i}'
    resp_a = requests.get(url_a, headers=headers)
    soup_a = bs(resp_a.content, "html.parser")

该代码在创建内容变量soup_a方面确实有用,但是每次循环执行时都会覆盖,因此该变量中唯一的数据是来自最终URL。 我尝试在循环之前创建一个空白[]并将结果附加到它上,但这只是给了我一个列表。 对于如何运行它到可变soup_a将包含来自所有五个URL的数据的位置,我感到不知所措。
python beautifulsoup
1个回答
0
投票

您只想将结果附加到列表中,而不是编写值。

soup_a_results = [] for i in range(1,6): url_a = f'https://www.mascotdb.com/native-american-high-school?page={i}' resp_a = requests.get(url_a, headers=headers) soup_a_results.append(bs(resp_a.content, "html.parser"))
现在将包含第一个条目(其中是第一个访问的网站,在您的代码中,这对应于

soup_a_results[j]

	
最新问题
© www.soinside.com 2019 - 2025. All rights reserved.