我有一个蜘蛛,我写的使用剪贴簿框架。我有一些困难,使任何管道的工作。我的pipelines.py中有以下代码:
class FilePipeline(object):
def __init__(self):
self.file = open('items.txt', 'wb')
def process_item(self, item, spider):
line = item['title'] + '\n'
self.file.write(line)
return item
我的crawpsider子类有这条线来激活这个类的管道。
ITEM_PIPELINES = [
'event.pipelines.FilePipeline'
]
但是当我使用
scrapy crawl my_spider
我接到电话说
2010-11-03 20:24:06+0000 [scrapy] DEBUG: Enabled item pipelines:
没有管道(我想这是日志应该输出它们的地方)。
我试过查看文档,但似乎没有任何完整的项目示例来查看是否遗漏了任何内容。
对下一步怎么做有什么建议吗?或者在哪里查找进一步的文档?
我敢打赌,这是某个地方“管道”这个词的资本差异:
管道与管道
我注意到
'event.pipelines.FilePipeline'
使用前者,而您的代码使用后者:您的文件名使用哪个?(我多次成为这个拼写错误的牺牲品!)
明白了!该行需要进入项目的“设置”模块。现在成功了!
相关问题 更多 >
编程相关推荐