下面的代码给出了 HTML 格式的输出。我对 DOCTYPE 感到困惑。这里 HTML 标签的父标签是什么?是 DOCTYPE 吗?
html = list(soup.children)[1] print(html)
DOCTYPE 是顶级声明,而不是 元素的父元素。
在 Beautiful Soup 中 从解析器获得的
BeautifulSoup
另请参阅 使用 BeautifulSoup 获取文档 DOCTYPE
不完全是。将 声明视为标签的同级而不是父级。这就像您打开网页时看到的第一件事,为 HTML 结构定下基调,但它不像父级那样直接包含标签。