剪贴画：提取链接和纹理

import scrapy from ikea.items import IkeaItem class IkeaSpider(scrapy.Spider): name = 'ikea' allowed_domains = ['http://www.ikea.com/'] start_urls = ['http://www.ikea.com/'] def parse(self, response): for sel in response.xpath('//tr/td/a'): item = IkeaItem() item['name'] = sel.xpath('a/text()').extract() item['link'] = sel.xpath('a/@href').extract() yield item

2条回答

网友

1楼 · 编辑于 2024-05-28 23:55:16

在项目字段的xpath表达式中有一个简单的错误。循环已经遍历了a标记，不需要在内部xpath表达式中指定a。换言之，当前您正在搜索a标记内的a标记内的td标记内的tr。显然结果是什么都没有。

用text()替换a/text()，用@href替换a/@href。

（已测试-对我有效）

网友

2楼 · 编辑于 2024-05-28 23:55:16

用这个。。。。

    item['name'] = sel.xpath('//a/text()').extract()
    item['link'] = sel.xpath('//a/@href').extract()

编程相关推荐

iOS MDM注册配置文件请求/Profile使用java对证书进行签名
java如何调试GWT项目中的PHP文件
Mac和Windows之间的Java文件getFreeSpace差异
java从ArrayList进入JComboBox
ApacheKafka如何执行zookeeperserverstart。我的java程序中的bat文件？
JAXRS应用程序的java初始化
java如何为double覆盖compareTo方法？
使用进程动态运行java代码
sockets java。网SocketException:权限被拒绝openshift
java PorterduffXfermode：清除位图的一部分

相关问题更多 >

编程相关推荐

热门问题

热门文章