尝试在Python中使用scrapy来刮取下表

def parse(self, response): hxs = HtmlXPathSelector(response) titles = hxs.select('//table[table[@class="OfficeTitleLink"]/td') for titles in titles: item = example_crawler item ["title"] = titles.select(".//text()").extract() item.append(item) return items

2条回答

网友

1楼 · 编辑于 2024-04-26 03:47:13

html表示例中的类名是“OfficeTitleLink”，代码中列出的类名是“OfficialTitleLink”，这是故意的吗？你知道吗

目标类在共享的html代码段中不存在。你知道吗

网友

2楼 · 编辑于 2024-04-26 03:47:13

<td class="OfficeTitleLink">
   @class="OfficialTitleLink"

你错了一件事，呵呵。不过，我不确定还有什么。你知道吗

编程相关推荐

java得到的分数是Android屏幕大小的25%
爪哇杰克逊。数据绑定。JsonNode（）在null字段上返回true（不应该返回）
java使用改型2获取和获取未知数据集
java Play框架：使用WS将图像发布到imageshack
高效eclipse的java最佳设置
swing KeyListener Java
无法解析java链表
java ListView内存问题
java在创建重载构造函数、实例化对象时遇到问题
如何在java中沿树进行预排序遍历，并打印0和1以对应每个节点上的特定字符？

相关问题更多 >

编程相关推荐

热门问题

热门文章

尝试在Python中使用scrapy来刮取下表

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >