从未使用Scrapy调用回调函数

import scrapy from nfl_predictor.items import NflPredictorItem class NflSpider(scrapy.Spider): name = "nfl2" allowed_domains = ["http://www.pro-football-reference.com/"] start_url = [ "http://www.pro-football-reference.com/boxscores/201509100nwe.htm" ] def parse(self, response): print "parse" for href in response.xpath('// [@id="page_content"]/div[1]/table/tr/td/a/@href'): url = response.urljoin(href.extract()) yield scrapy.Request(url, callback=self.parse_game_content) def parse_game_content(self, response): print "parse_game_content" items = [] for sel in response.xpath('//table[@id = "team_stats"]/tr'): item = NflPredictorItem() item['away_stats'] = sel.xpath('td[@align = "center"][1]/text()').extract() item['home_stats'] = sel.xpath('td[@align = "center"][2]/text()').extract() items.append(item) return items

1条回答

网友

1楼 · 发布于 2024-05-19 22:11:24

默认情况下，parse命令获取给定的URL，并使用处理它的spider来解析它，使用callback选项传递的方法，否则就解析给。在你的情况下，它只解析解析函数。更改命令使 callback如下所示：

scrapy parse  spider=nfl2 "http://www.pro-football-reference.com/boxscores/201509100nwe.htm"  callback=parse_game_content

另外，最好更改parse_game_content函数，如下所示

和13；

相关问题更多 >

编程相关推荐

热门问题

热门文章