蹩脚的SgmlLinkExtractor规则和回调会让人头痛我想做的是: class SpiderSpider(CrawlSpider): name = "lolies" allowed_domains = ["domain.com"] ...2024-04-29 已阅读: n次
Scrapy sqmllinkextractor规则更改URL我正在尝试使用Scrapy构建一个webcrawler spider,并为我希望爬虫程序使用regex获取的链接设置了一个规则: rules = (Rule(SgmlLinkExtractor(all ...2024-04-29 已阅读: n次