Scrapy 爬虫的 domain_name

1 投票
2 回答
702 浏览
提问于 2025-04-15 16:25

来自Scrapy教程的内容:

domain_name:用来识别爬虫(Spider)。它必须是唯一的,也就是说,你不能为不同的爬虫设置相同的域名。

这是不是意味着 domain_name 必须是一个有效的域名,比如:

domain_name = 'example.com'

还是说我可以命名为:

domain_name = 'ex1'

问题是我有一个爬虫,它的域名是:

domain_name = 'whitecase.com'

现在我创建了一个新的爬虫,作为CrawlSpider的实例,并命名为:

domain_name = 'wc2'

但我收到了错误信息 "找不到域名为 "wc2" 的爬虫"

2 个回答

0

正如你自己发现的,domain_name 这个名字不需要是真实存在的。它是在调用爬虫去抓取数据时使用的。

1

为了回答我自己的问题:

domain_name = 'wc2'

这样写是可以的。

撰写回答