我分析网站,它工作得很好,但我需要添加新的列与id的输出。该列以csv格式保存,URL为:
https://www.ceneo.pl/48523541, 1362
https://www.ceneo.pl/46374217, 2457
我的蜘蛛代号:
^{pr2}$在结果中,我得到了错误的数据,因为(zip函数?)ID交替使用:
urlid,price,seller
1362,109,eMAG
1457,116,electro.pl
1362,597,apollo.pl
1457,597,allegro.pl
它应该输出:
urlid,price,seller
1362,109,eMAG
1362,116,electro.pl
1457,597,apollo.pl
1457,597,allegro.pl
您可以在},并使用}中可以使用}。在
start_requests
中获得{meta={'id': id_}
分配给请求,稍后在{response.meta['id']
获得{这样您将在
parse
中得到正确的ID
。在我使用字符串
data
而不是file来创建工作示例。在顺便说一句:有标准函数}
id()
,所以我使用变量id_
而不是{相关问题 更多 >
编程相关推荐