我怎样才能刮出所有工具从网站与动态路由
http://growthtools.io/social-media-automation-tools
当我试图
scrapy shell 'http://growthtools.io/social-media-automation-tools'
我收到了以下结果
^{pr2}$并且response
对象不包含tools
元素。在
In [3]: In [2]: response.css('.toolsList')
Out[3]: []
In [5]: 'toolsList' in response.body
Out[5]: False
谁能描述我如何解析http://growthtools.io/social-media-automation-tools以及为什么{
页面加载涉及由浏览器执行的JavaScript,Scrapy不是。不过,您可以使用^{} 来解决它,它提供了一个中间件用于您的Scrapy项目。中间件使用^{} JS rendering service ,您可以通过docker运行它。在
至于在废壳中测试它,可以遵循this example to run it from the shell。在
为我工作:
相关问题 更多 >
编程相关推荐