找到下一个同胞,直到使用beautifulsoup找到某个同胞

问题描述 投票:8回答:2

该网页是这样的:

<h2>section1</h2>
<p>article</p>
<p>article</p>
<p>article</p>

<h2>section2</h2>
<p>article</p>
<p>article</p>
<p>article</p>

如何找到其中包含文章的每个部分?也就是说,在找到h2之后,找到下一个兄弟姐妹

直到下一个h2。

如果网页类似于:(通常是这种情况)

<div>
<h2>section1</h2>
<p>article</p>
<p>article</p>
<p>article</p>
</div>

<div>
<h2>section2</h2>
<p>article</p>
<p>article</p>
<p>article</p>
</div>

我可以写类似的代码:

for section in soup.findAll('div'):
...
    for post in section.findAll('p')

但是,如果我想获得相同的结果,该如何处理第一个网页?

python find beautifulsoup scrape siblings
2个回答
8
投票
我认为您可以执行以下操作:

0
投票
next_siblings迭代器也可以在这里提供帮助:
© www.soinside.com 2019 - 2024. All rights reserved.