Scrapy 爬虫的 domain_name
来自Scrapy教程的内容:
domain_name:用来识别爬虫(Spider)。它必须是唯一的,也就是说,你不能为不同的爬虫设置相同的域名。
这是不是意味着 domain_name
必须是一个有效的域名,比如:
domain_name = 'example.com'
还是说我可以命名为:
domain_name = 'ex1'
问题是我有一个爬虫,它的域名是:
domain_name = 'whitecase.com'
现在我创建了一个新的爬虫,作为CrawlSpider的实例,并命名为:
domain_name = 'wc2'
但我收到了错误信息 "找不到域名为 "wc2" 的爬虫"
2 个回答
0
正如你自己发现的,domain_name
这个名字不需要是真实存在的。它是在调用爬虫去抓取数据时使用的。
1
为了回答我自己的问题:
domain_name = 'wc2'
这样写是可以的。