如何使用BeautifulSoup查找与类的href链接

问题描述 投票:0回答:2
<div data-pet-card="pet-card" class="pet-card">

    <a data-pet-card="pet-card-link" href="https://Link-I-Want.com" 
    class="pet-card__link">

我习惯用BS4抓取html,但我对html本身并不是很熟悉,也没有遇到过一个也有类和data-pet-card="pet-card-link"的href。我试过了:

for a in soup.find_all('a', href=True):
    print("Found the URL:", a['href'])

但它什么都不打印,没有错误。

什么都有帮助,谢谢。

python python-3.x parsing beautifulsoup request
2个回答
2
投票

你在find_all调用中放置的属性是你拥有的,而不是你想要找到的东西。这里有类,所以使用:

for a in soup.find_all('a', class_="pet-card__link"):
    print("Found the URL:", a['href']) 

(因为class是Python中的保留字,所以你需要在这里使用class_。)


0
投票
for a in soup.find_all('a', href=True):
    print("Found the URL:", a.get_attribute_list('href')[0])

请试试这个解决方案。

© www.soinside.com 2019 - 2024. All rights reserved.