[在Python中使用Beautiful Soup删除多个具有相同名称的div类

问题描述 投票:0回答:1

我已成功抓取了网页的图像和标题(代码中的URL)。我要对本页上的所有电影执行此操作。 “ movie_list”包含所有这些内容,但是只刮取了第一部电影信息。

我尝试将.find更改为.find_all,但这给了我一个错误。

url = 'https://5movies.to/movie/'
content = session.get(url, verify=False).content
soup = BeautifulSoup(content, "html.parser")
movie_list = soup.find_all('div', {'class': 'movie-list'})
all_item = []

for allContainers in movie_list:
    filmName = allContainers.find('img').get('alt')
    filmFoto = allContainers.find('img').get('src')
    filmLink = allContainers.find('a').get('href')
print(filmName)
python for-loop web-scraping beautifulsoup pycharm
1个回答
0
投票

for循环内移动print语句使它打印出整个列表。实际上,我将print替换为all_item.append((filmName, filmFoto, filmLink))以将其发送到前端。

感谢@furas提供信息!

content = session.get(url, verify=False).content
soup = BeautifulSoup(content, "html.parser")
movie_list = soup.find_all('div', {'class': 'movie-list'})
all_item = []

for allContainers in movie_list:
    filmName = allContainers.find('img').get('alt')
    filmFoto = allContainers.find('img').get('src')
    filmLink = allContainers.find('a').get('href')
    print(filmName)
© www.soinside.com 2019 - 2024. All rights reserved.