抓取和解析后存储数据

[ <td>Name :</td>, <td>xyz</td>, <td>Mobile :</td>, <td>180-14587962</td>, <td>Company:</td>, <td>abc Comp</td>, <td>Name :</td>, <td> </td>, <td>Mobile :</td>, <td> </td>, <td>Company:</td>, <td> </td>, <td>Name :</td>, <td> </td>, <td>Mobile :</td>, <td> </td> ]

2条回答

网友

1楼 · 编辑于 2024-04-24 23:51:28

您可以使用以下方法：

from bs4 import BeautifulSoup
html = """
 <td>Name :</td>,   <td>xyz</td>, 
 <td>Mobile :</td>, <td>180-14587962</td>, 
 <td>Company:</td>, <td>abc Comp</td>, 
 <td>Name :</td>,   <td>  </td>, 
 <td>Mobile :</td>, <td>  </td>, 
 <td>Company:</td>, <td>  </td>, 
 <td>Name :</td>,   <td>  </td>, 
 <td>Mobile :</td>, <td>  </td> 
"""
soup = BeautifulSoup(html, "lxml")
x = soup.find_all("td")
print x[1]
print x[3]

标准输出

<td>xyz</td>
<td>180-14587962</td>

演示

http://ideone.com/xDzeni

网友

2楼 · 编辑于 2024-04-24 23:51:28

我就是这样解决的

for tag in soup.findAll('td'):
  if tag.text.strip("\n").strip(' ').strip("\n")== 'Name :':
      inter=tag.find_next_sibling()
      list_name.append(inter.text.strip("\n").strip(' ').strip("\n"))
  if tag.text.strip("\n").strip(' ').strip("\n")== 'Mobile :':
      inter=tag.find_next_sibling()
      list_mobile.append(inter.text.strip("\n").strip(' ').strip("\n"))

循环遍历所有td标记以查找“Name:”或“Mobile:”，并将下一个标记（包含值）添加到单独的列表中

相关问题更多 >

编程相关推荐

热门问题

热门文章

抓取和解析后存储数据

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >