如何使用python和beautifulsoup对象从下面的代码中抓取贡献者？

问题描述投票：-4回答：1

我需要使用python和美丽的汤从网站上抓取数据。我有以下HTML代码，我只需要抓取贡献者。

<a href="website//contributors">
<span class="num text-emphasized">
  731
</span>
"contributors"
</a>

如何从这段代码中抓取731这是贡献者的数据？我无法使用span和class =“num text-emphasized”，因为它不是贡献者独有的。我需要从这个HTML文件中删除731？请帮忙？

python html beautifulsoup

1个回答

0
投票

对于您提供的HTML，您可以按如下方式提取731：

from bs4 import BeautifulSoup

html = """<a href="website//contributors">
<span class="num text-emphasized">
  731
</span>
"contributors"
</a>"""

soup = BeautifulSoup(html, "html.parser")
contributor_data = soup.a.span.get_text(strip=True)

最新问题

© www.soinside.com 2019 - 2024. All rights reserved.