如何从具有多个td嵌套标记的表中提取

2024-04-25 07:48:28 发布

您现在位置:Python中文网/ 问答频道 /正文

我已经从这个页面(http://www.itjuzi.com/company/934)获取了数据,但是我想要的是一个包含子td标记的列表和一个带有父td标记的列表。在

代码如下:

response.xpath("//table[@class='list-round-v2']//tr/td[4]//text()").extract()

结果如下:

^{pr2}$

enter image description here


Tags: 数据代码标记comhttp列表responsewww
1条回答
网友
1楼 · 发布于 2024-04-25 07:48:28

这就行了

textlist=[]
for row in response.xpath("//table[contains(@class,'list-round-v2')]//tr"):
    textlist.append(row.xpath("td[4]//text()[parent::a|parent::span]").extract())

相关问题 更多 >