<div data-pet-card="pet-card" class="pet-card">
<a data-pet-card="pet-card-link" href="https://Link-I-Want.com"
class="pet-card__link">
我习惯用BS4抓取html,但我对html本身并不是很熟悉,也没有遇到过一个也有类和data-pet-card="pet-card-link"
的href。我试过了:
for a in soup.find_all('a', href=True):
print("Found the URL:", a['href'])
但它什么都不打印,没有错误。
什么都有帮助,谢谢。
你在find_all
调用中放置的属性是你拥有的,而不是你想要找到的东西。这里有类,所以使用:
for a in soup.find_all('a', class_="pet-card__link"):
print("Found the URL:", a['href'])
(因为class
是Python中的保留字,所以你需要在这里使用class_
。)
for a in soup.find_all('a', href=True):
print("Found the URL:", a.get_attribute_list('href')[0])
请试试这个解决方案。