刮痧：换衣服输出方式d

{"leisurelocation": ["(\u5357\u6295)"], "leisuretitle": ["2014"]}, {"leisurelocation": ["(\u53f0\u5357)"], "leisuretitle": ["20140721"]}, {"leisurelocation": ["(\u53f0\u5357)"], "leisuretitle": ["20140726"]}]

def parse(self, response): sel = Selector(response) sites = sel.css("div#listabc table ") for site in sites: item = LeisureItem() leisurelocation = site.css(" tr > td.subject > span.city::text ").extract() leisuretitle = site.css(" tr > td.subject a::text ").extract() item['leisurelocation'] = leisurelocation item['leisuretitle'] = leisuretitle yield item

2条回答

网友

1楼 · 编辑于 2024-04-25 14:15:28

您需要从leisurelocation和leisuretitle生成多个项：

leisurelocation = ...
leisuretitle =  ...

for i,j in zip(leisurelocation, leisuretitle):
    yield LeisureItem(leisurelocation=[i], leisuretitle=[j])

网友

2楼 · 编辑于 2024-04-25 14:15:28

kev的答案对于你定义的问题是正确的，但我认为这不是正确的方法。你应该一件一件地刮。你知道吗

例如，逐行循环表并将每个刮下的行作为一个项生成：

def parse(self, response):
    for city in response.css("div#listabc table>tr"):
        item = LeisureItem()
        item['leisurelocation'] = city.css("td.subject>span.city::text").extract()
        item['leisuretitle'] = city.css("td.subject a::text").extract()
        yield item

相关问题更多 >

编程相关推荐

热门问题

热门文章