检查特殊字符串:
Tag、NavigableString 和 BeautifulSoup 几乎涵盖了您在 HTML 或 XML 文件中看到的所有内容,但还有一些剩余的部分。您可能会遇到的主要问题是评论。
一个简单的解决方案可能是替换 HTML 字符串中的 注释字符,以将其显示为
BeautifulSoup
:
soup = BeautifulSoup(
requests.get('https://www.baseball-reference.com/postseason/1905_WS.shtml').text.replace('<!--','').replace('-->','')
)
更具体的替代方法是使用 bs4.Comment