我需要帮助来安排我的蜘蛛每N分钟跑一次。早期我看到大多数人都使用reactor.callLater
和{
def run_crawl():
"""
Run a spider within Twisted. Once it completes,
wait 5 seconds and run another spider.
"""
runner = CrawlerRunner(get_project_settings())
runner.crawl(SpiderA)
runner.crawl(SpiderB)
deferred = runner.join()
deferred.addCallback(reactor.callLater, 5, run_crawl)
return deferred
run_crawl()
reactor.run()
现在我的爬虫程序是由Windows任务调度器调度的,但是我想用编程的方式安排它。在
您可以尝试使用名为
schedule
的外部模块:schedule github link
如果不符合你的需要就告诉我。在
相关问题 更多 >
编程相关推荐