重定向后未在scray中调用回调函数

from scrapy.selector import Selector from scrapy.contrib.linkextractors.sgml import SgmlLinkExtractor from scrapy.contrib.spiders import CrawlSpider, Rule from sandbox.items import SandboxItem class SandboxCrawlSpider(CrawlSpider): name = 'sandbox_crawl' allowed_domains = ['amazonaws.com'] start_urls = ['http://www.amazonaws.com/'] rules = ( Rule(SgmlLinkExtractor(), callback=('parse_item'), follow=True), ) def parse_item(self, response): sel = Selector(response) i = SandboxItem() print response.url return i

2条回答

网友

1楼 · 编辑于 2024-06-06 21:37:29

只需将"aws.amazon.com"添加到allowed_domains

allowed_domains = ['amazonaws.com', 'aws.amazon.com']

网友

2楼 · 编辑于 2024-06-06 21:37:29

向请求添加dont_filter=True，但这并不能最终解决问题。在

像这样：

Request('http://example.org/', callback = self.func, dont_filter=True)

编程相关推荐

java如何通过编程更改安卓中imagebutton的大小
Java Web应用程序中的angularjs路由
以更智能的方式在JUnit5（或其他测试Java库）中使用数组进行参数化
java在16位颜色深度的Graphics2D中绘制时颜色错误
java有可能在需要时从Firebase手动检索数据，以及如何组合查询？
格拉德尔爪哇。lang.NoSuchFieldError:md2
java中的循环乘法表错误
用于检测圆括号的java正则表达式
如果我们使用新字符串（“abcd”），java就是在堆中创建的字符串对象
java有没有办法让JOptionPane下拉菜单为所选选项输出数字？

相关问题更多 >

编程相关推荐

热门问题

热门文章