BeautifulSoup find_all() 方法在 HTML 注释标记后停止

问题描述 投票:0回答:1
python beautifulsoup
1个回答
0
投票

检查特殊字符串

Tag、NavigableString 和 BeautifulSoup 几乎涵盖了您在 HTML 或 XML 文件中看到的所有内容,但还有一些剩余的部分。您可能会遇到的主要问题是评论。

一个简单的解决方案可能是替换 HTML 字符串中的 注释字符,以将其显示为

BeautifulSoup
:

soup = BeautifulSoup(
        requests.get('https://www.baseball-reference.com/postseason/1905_WS.shtml').text.replace('<!--','').replace('-->','')
)

更具体的替代方法是使用 bs4.Comment

© www.soinside.com 2019 - 2024. All rights reserved.