我正在尝试使用漂亮的汤编写代码,打印this网页上左手灰色框中的链接文本。在这种情况下,代码应该返回
** Enchantments Bouldering
Aasgard Sentinel
Argonaut Peak
Cashmere Mountain
Colchuck Balanced Rock
Colchuck Peak
Crystal Lake Tower
Dragontail Peak
Flagpole, The
Headlight Basin
Ingalls Peak
Jabberwocky Tower
Mt Stuart
Nightmare Needles
Prusik Peak
Rat Creek Spires
Sherpa Peak
Stuart Lake Basin
Viviane Campsite
Witches Tower
我试图概括this非常相似的问题的精彩答案,但是在检查我的新网页的源代码时,我找不到正在使用的表格,并且无法破译容器在以下代码行:
table = soup.find(lambda tag: tag.name=='???' and tag.has_attr('??') and tag['id']=="???")
rows = table.findAll(lambda tag: tag.name=='a')
如果你已经有汤了,那么你只需要找到主容器即可。这是
mp-sidebar
类的 div,然后获取所有链接
links = soup.select('div.mp-sidebar a')
for link in links:
print(link.text)