我使用urllib在python中进行web抓取。在我想浏览的网页上,我有以下HTML代码:
<module type="Product Model">
<div class = "">
<div class="">
<div class = "a on"> ...... </div>
<div class = "b"> </div>
<div class = "b"> </div>
</div>
</div>
</module>
如果我们通过添加“on”来操作div,就可以访问div中的所有数据
<div class = "b on"> .... </div>
<div class = "c on"> .... </div>
我想访问module标记中的所有数据,但是当我从网页中抓取数据时,我只能看到那些在类(即on)上附加了“on”的div的值
div class = "a on"
如何访问所有div?有什么方法可以从python操作div吗?
下面是python代码:
print (soup.find("module", {"id":"Product Model"}))
目前没有回答
相关问题 更多 >
编程相关推荐