其他Python工具

avoin的Python项目详细描述


#雅芳 数据抓取的python代码 (c)2012年Ville Korhonen(ville@xd.fi),GPLv3

##安装 您可以使用以下命令直接从pypi安装:

pip install avoin

或者通过git获得最新的头部:

pip install git+https://github.com/ypcs/avoin.git#egg=avoin
使用(通过python shell)
>>> from avoin.scraper.scraper import DefaultScraper, html_title_parser
>>> scraper = DefaultScraper()
>>> url = 'http://www.google.com/'
>>> result = scraper.parse(url, parser=html_title_parser)
>>> print result
Google
>>> result = scraper.parse(url, parser=html_title_parser, format='json')
>>> print result
"Google"

##使用(通过命令行) 以明文形式从网页获取所有URL

avoin xpath –url ‘http://ypcs.fi/’ –xpath ‘//a/@href’ –format text

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java FirebaseInstanceId。getInstance()始终为空   linux Java执行文件错误   javaspringboot:如何使用Ajax在springboot和Thymeleaf中创建进度条?   java禁用在安卓上使用传单时启用setJavaScriptEnabled   java如何在主体中发布原始类型JSON数据?   消除JAVA While循环中的额外输出   如何在java中直接将基本数据类型分配给自定义类   java为什么addNode()方法返回编译错误“类型中的方法…不适用于参数…”,我该如何修复它?   java惰性合成可观察对象   eclipse Java Blackberry位图单击   java Android:AsyncTask对象[]无法在doInBackground中强制转换   java有没有办法重构或改进这段代码?   java如何使用系统以十六进制打印字节。出来普林顿?   多线程如何在我的java聊天室中调试“java.net.UnknownHostException”?   java如何从Google App Engine下载应用程序源文件   java如何在Spring Data Mongo的聚合$group中使用类似$dateToString   java IBM websphere application server未在MyEclipse8中启动。0