使用arc和warc文件的python库

warc3-wet的Python项目详细描述


warcc3-wet warc3-wet:python3库与warc和wet文件一起工作的python3库与warc和wet文件一起工作
===============================



<注意:这是原始(现在已经死亡)warc存储库的一个叉。








这个“warc”warc/warc这个“warc”文件是原始(现在已经死亡)warc存储库的一个叉。

<图书馆使工作变得很容易使用warc文件。:

记录['content-length'])


和wet文件。:


导入warc
使用warc.open(“test.warc.wet”)作为f:
记录在f:
打印(记录['warc-target-uri'],记录[“内容长度])


文档
----




上找到,除了从PIP安装(此版本不适用于此warc3版本)之外,此处描述的
接口保持不变。

许可证
--


是GPL v2授权的。有关详细信息,请参见许可证文件。

…许可证:http://github.com/internetarchive/warc/blob/master/license/master/license


>作者
-









*原始python2版本:



*Anand-Chitipitothu
*Noufal-ibrahim



*Ryan Chartier
*Jan Pieter Br-Br/>*Jan Pieter Br Br-Br/>*Almer S.Tigelaar







br/>更改日志
----
0.2.3
支持在warc中查找/wet


0.2.2
允许wet parse

older…
请参阅https://github.com/internetarchive/warc

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java web爬虫:使用selenium+webdriver遍历页面链接时出现两种异常   java JPA和SYS_REFCURSOR-like OUT参数   非空参数的java方法引用?   xml中的java子节点名称   java为什么GC不在同一个方法中运行   java如何检查可执行JAR是否已在另一个JVM中完成   将外观更改为Nimbus后出现jtable Java错误   用户界面Java Swing架构问题?   java导入自定义字体时我做错了什么?   java如何用API制作可伸缩的游戏策划   java玩家和方块的碰撞和交集   java增强的for循环   java propertiesmavenplugin不适用于目标writeprojectproperties   java循环返回代码的开头   java使用分号执行apachecommonsexec多个命令   Wicket应用程序中的java全局可访问资源   java在eclipse中设置参数时可以使用类名而不是id吗?   eternal和maxElementsInMemory在ehcache中的java角色?   java ClassCastException在同一个ear中从两个不同的WAR加载同一个类时,由于类装入器不同