我有一个 html,我想使用
BeautifulSoup
来提取元素 <div id="aa" class="bb">
。我可以做soup.select('div[id="aa"]')
和soup.select('div[id="bb"]')
。
是否有语法来强制执行约束
div[id="aa"]
和div[id="bb"]
?非常感谢您的帮助!
我假设您想用
<div>
和 id="aa"
选择 class="bb"
:
from bs4 import BeautifulSoup
html_text = """\
<div id="aa" class="aa">This I don't want</div>
<div id="aa" class="bb">This I want</div>
<div id="aa" class="cc">This I don't want</div>"""
soup = BeautifulSoup(html_text, "html.parser")
print(soup.select("div#aa.bb"))
打印:
[<div class="bb" id="aa">This I want</div>]