[我正在尝试使用Beautiful Soup从Yelp搜索结果页面抓取个人资料URL。这是我目前拥有的代码:
url="https://www.yelp.com/search?find_desc=tree+-+removal+-+&find_loc=Baltimore+MD&start=40"
response=requests.get(url)
data=response.text
soup = BeautifulSoup(data,'lxml')
for a in soup.find_all('a', href=True):
with open(r'C:\Users\my.name\Desktop\Yelp-URLs.csv',"a") as f:
print(a,file=f)
这为我提供了页面上的每个href链接,而不仅仅是个人资料URL。另外,当我只需要业务资料URL时,我会得到完整的类字符串(类柠檬。...)。
请帮助。
[我正在尝试使用Beautiful Soup从Yelp搜索结果页面抓取个人资料URL。这是我目前拥有的代码:url =“ https://www.yelp.com/search?find_desc = tree +-+ removal +-+&...
您可以通过使用select来缩小href限制。