Scrapy 爬虫的 domain_name

1 投票

2 回答

702 浏览

提问于 2025-04-15 16:25

来自Scrapy教程的内容：

domain_name：用来识别爬虫（Spider）。它必须是唯一的，也就是说，你不能为不同的爬虫设置相同的域名。

这是不是意味着 domain_name 必须是一个有效的域名，比如：

domain_name = 'example.com'

还是说我可以命名为：

domain_name = 'ex1'

问题是我有一个爬虫，它的域名是：

domain_name = 'whitecase.com'

现在我创建了一个新的爬虫，作为CrawlSpider的实例，并命名为：

domain_name = 'wc2'

但我收到了错误信息 "找不到域名为 "wc2" 的爬虫"

错误处理网络爬虫唯一性 scrapy 爬虫 domain_name crawlspider 爬虫实例

2 个回答

正如你自己发现的，domain_name 这个名字不需要是真实存在的。它是在调用爬虫去抓取数据时使用的。

回答于 2025-04-15 由 Python大师

分享举报

为了回答我自己的问题：

domain_name = 'wc2'

这样写是可以的。

回答于 2025-04-15 由 Python大师

分享举报