Div操作| Python | Urllib

2024-04-25 06:30:41 发布

您现在位置:Python中文网/ 问答频道 /正文

我使用urllib在python中进行web抓取。在我想浏览的网页上,我有以下HTML代码:

  <module type="Product Model">
    <div class = ""> 
      <div class="">
         <div class = "a on"> ......  </div>
         <div class = "b"> </div>
         <div class = "b"> </div>
      </div> 
    </div>
  </module>

如果我们通过添加“on”来操作div,就可以访问div中的所有数据

 <div class = "b on"> .... </div>
 <div class = "c on"> .... </div>

我想访问module标记中的所有数据,但是当我从网页中抓取数据时,我只能看到那些在类(即on)上附加了“on”的div的值

  div class = "a on" 

如何访问所有div?有什么方法可以从python操作div吗?

下面是python代码:

 print (soup.find("module", {"id":"Product Model"}))

Tags: 数据方法代码标记divweb网页model