一种高级的跨协议url抓取器

urlgrabber的Python项目详细描述


一个高级的跨协议url抓取器。

使用url grabber,数据可以通过三种基本方式获取:

urlgrab(url)将文件复制到本地文件系统
url open(url)打开远程文件并返回一个文件对象
(类似于urllib2.urlopen)
urlread(url)在使用这些函数(或方法)时将文件内容作为字符串返回,urlgrabber支持
以下功能:

*http://、ftp://、file://urls的相同行为
*http keepalive-使用
仅使用一个连接
*字节范围-仅获取文件的一部分
*reget-对于urlgrab,继续部分下载
*进度表-能够自动报告下载进度
,即使使用urlopen!
*限制-限制带宽使用
*重试-如果下载失败,自动重试。重试和故障类型的BR/>数量是可配置的。
对HTTP和FTP:BR/> *代理支持的认证服务器访问-支持已验证的HTTP和FTP代理
*镜像组-将镜像列表视为单个源,
如果出现故障,则自动切换镜像。

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
javascript如何找到socket。同一局域网上的IO服务器?   将Java代码格式化为Word/RTF格式   java学习对象以及如何将分配的变量封装到私有变量   java Websocket客户端不在Tomcat中工作   java如何在点击按钮时打开本机表情键盘?   java使用哪个Maven GlassFish插件?   Eclipse Java构建路径不允许添加外部JAR   继承Java6集合。勾选适当的用法   JavaApacheDateUtils:使用多个模式解析日期   java hibernate如何生成查询?   具有id或链接的java Dropbox下载文件或文件夹   java模态对话框未在PrimeFaces 5上显示   java将类对象转换为人类可读的字符串   更新数据库中字段的java通用方法   java无法通过Apache Tomcat访问网络文件夹