ruia_motor-一个使用马达存储数据的ruia插件

ruia-motor的Python项目详细描述


瑞亚汽车

使用马达存储数据的Ruia插件

Notice:  Works on ruia >= 0.5.0

安装

pip install -U ruia-motor

使用量

ruia-motor将自动将数据存储到MongoDB:

fromruiaimportAttrField,Item,Spider,TextFieldfromruia_motorimportRuiaMotorclassDoubanItem(Item):target_item=TextField(css_select='div.item')title=TextField(css_select='span.title')cover=AttrField(css_select='div.pic>a>img',attr='src')abstract=TextField(css_select='span.inq',default='')asyncdefclean_title(self,title):ifisinstance(title,str):returntitleelse:return''.join([i.text.strip().replace('\xa0','')foriintitle])classDoubanSpider(Spider):start_urls=['https://movie.douban.com/top250']mongodb_config={'host':'127.0.0.1','port':27017,'db':'ruia_motor'}asyncdefparse(self,response):etree=response.html_etreepages=['?start=0&filter=']+[i.get('href')foriinetree.cssselect('.paginator>a')]forindex,pageinenumerate(pages):url=self.start_urls[0]+pageyieldself.request(url=url,metadata={'index':index},callback=self.parse_item)asyncdefparse_item(self,response):asyncforiteminDoubanItem.get_items(html=response.html):data=item.resultsyieldRuiaMotor(collection='douban250',data=data)asyncdefinit_plugins_after_start(spider_ins):RuiaMotor.init_spider(spider_ins=spider_ins)if__name__=='__main__':DoubanSpider.start(after_start=init_plugins_after_start)

享受吧:)

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java Android:在ListView上使用setOnItemClickListener   使用Netbeans 7.0连接到SQL Server的java正在挂起   java Spring3依赖项注入不适用于mule   java Flink SQL结果字段与LocalDateTime上请求的类型错误不匹配   java找不到文件的结尾   考虑到NamingStrategy,java有没有办法将字符串转换为JsonNode?   使用Netbeans/ant部署java(命令行)应用程序   java如何修复Spring引导多部分上载中的“所需请求部分不存在”   java在应用程序启动时通过引用获取映射未知目标实体属性异常   java形状旋转问题Java2d   Weblogic服务器上的java ExecuteAndWaitInterceptor问题   JavaSpringBoot:project将图像保存在错误的路径中,并且在使用IDEIntellji打开时不显示图像   类向java接口添加方法   Swing组件上的Java 7泛型   sql server如何从java获取用户名。sql。联系   java如何检查该行是否与正则表达式(regex)冲突?   java如何在spring引导安全中为计数失败登录设置验证登录为false   图像如何在Java中使PNG的白色透明?