使用arc和warc文件的python库

warc3-wet的Python项目详细描述


warcc3-wet warc3-wet:python3库与warc和wet文件一起工作的python3库与warc和wet文件一起工作
===============================



<注意:这是原始(现在已经死亡)warc存储库的一个叉。








这个“warc”warc/warc这个“warc”文件是原始(现在已经死亡)warc存储库的一个叉。

<图书馆使工作变得很容易使用warc文件。:

记录['content-length'])


和wet文件。:


导入warc
使用warc.open(“test.warc.wet”)作为f:
记录在f:
打印(记录['warc-target-uri'],记录[“内容长度])


文档
----




上找到,除了从PIP安装(此版本不适用于此warc3版本)之外,此处描述的
接口保持不变。

许可证
--


是GPL v2授权的。有关详细信息,请参见许可证文件。

…许可证:http://github.com/internetarchive/warc/blob/master/license/master/license


>作者
-









*原始python2版本:



*Anand-Chitipitothu
*Noufal-ibrahim



*Ryan Chartier
*Jan Pieter Br-Br/>*Jan Pieter Br Br-Br/>*Almer S.Tigelaar







br/>更改日志
----
0.2.3
支持在warc中查找/wet


0.2.2
允许wet parse

older…
请参阅https://github.com/internetarchive/warc

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
如何在Java和Javascript之间共享常量   c#无法使用Gson反序列化字节[]   如果字符串是实十进制数字,则在Java中仅显示十进制数字   与Android Studio的java FireBase同步失败   web应用程序的Java Oracle数据库更改通知问题   数组中缺少整数的java嵌套循环   zos在z/os上以TOD格式(一天中的时间)转换Java时间戳   java JAXB未根据注释生成XML(JDK 1.7)   java使用Twitter4j和Geolocation查找在该地区发布推文的用户,但如何获取用户ID?   在Libgdx中实现简单运动模糊的java意外结果   java在Android数据库中插入另一个EditText值?   java标准偏差数组(我的算法错误)   java如何修复M1 Mac的Ant javascript标记?   java遍历树标记值的长度   java理解Springboot中的Cron,自动发送电子邮件   java如何将“Data.Json”文件从资产保存到内部存储器,然后将其用于读/写   java代码在编写FirstDuplicate方法时会遇到时间限制问题   java将HTML转换为PDF并将其添加到段落中   javascript css()未设置正文标记的背景属性