网页是这样的:
<h2>section1</h2>
<p>article</p>
<p>article</p>
<p>article</p>
<h2>section2</h2>
<p>article</p>
<p>article</p>
<p>article</p>
我怎样才能找到每一部分的文章?也就是说,在找到h2之后,找到下一个h2之前的下一个siblings
。
如果网页是这样的:(通常是这样的)
<div>
<h2>section1</h2>
<p>article</p>
<p>article</p>
<p>article</p>
</div>
<div>
<h2>section2</h2>
<p>article</p>
<p>article</p>
<p>article</p>
</div>
我可以编写如下代码:
for section in soup.findAll('div'):
...
for post in section.findAll('p')
但是如果我想得到同样的结果,我应该怎么处理第一个网页呢?
我想你可以这样做:
给出:
输出:
相关问题 更多 >
编程相关推荐