我应该使用哪个CSS选择器来访问网站图表上的数字(python)

问题描述 投票:0回答:1

我试图从这个页面上的图表中提取一些数字(qazxsw poi)

该图表中有5个选项卡。

我对第5个标签感兴趣(报纸)。

当我运行这段代码时,我得到了一些关于第一个选项卡图的信息。

但是soup.find_all('',id ='neighbors-newspapers')返回一个空白。

https://www.zoopla.co.uk/local-info/?outcode=cm15&incode=9bq

我不确定如何访问id中的id,如果它是什么。有人可以帮忙吗?

python web web-scraping beautifulsoup
1个回答
1
投票

您可以使用正则表达式和请求

from bs4 import BeautifulSoup as bs
import requests

res=requests.get('https://www.zoopla.co.uk/local-info/?outcode=cm15&incode=9bq')
soup = bs(res.content, 'lxml')

housing = [item.text.replace('\n','').strip() for item in soup.find_all('',id='local-info-neighbours')]
print(housing)

newspapers = [item.text.replace('\n','').strip() for item in soup.find_all('',id='neighbours-newspapers')]
print(newspapers)
© www.soinside.com 2019 - 2024. All rights reserved.