使用arc和warc文件的python库
warc3-wet的Python项目详细描述
warcc3-wet warc3-wet:python3库与warc和wet文件一起工作的python3库与warc和wet文件一起工作
===============================
<注意:这是原始(现在已经死亡)warc存储库的一个叉。
这个“warc”warc/warc这个“warc”文件是原始(现在已经死亡)warc存储库的一个叉。
<图书馆使工作变得很容易使用warc文件。:
记录['content-length'])
和wet文件。:
导入warc
使用warc.open(“test.warc.wet”)作为f:
记录在f:
打印(记录['warc-target-uri'],记录[“内容长度])
文档
----
上找到,除了从PIP安装(此版本不适用于此warc3版本)之外,此处描述的
接口保持不变。
许可证
--
是GPL v2授权的。有关详细信息,请参见许可证文件。
…许可证:http://github.com/internetarchive/warc/blob/master/license/master/license
>作者
-
*原始python2版本:
*Anand-Chitipitothu
*Noufal-ibrahim
*Ryan Chartier
*Jan Pieter Br-Br/>*Jan Pieter Br Br-Br/>*Almer S.Tigelaar
br/>更改日志
----
0.2.3
支持在warc中查找/wet
0.2.2
允许wet parse
older…
请参阅https://github.com/internetarchive/warc
===============================
<注意:这是原始(现在已经死亡)warc存储库的一个叉。
这个“warc”warc/warc这个“warc”文件是原始(现在已经死亡)warc存储库的一个叉。
<图书馆使工作变得很容易使用warc文件。:
记录['content-length'])
和wet文件。:
导入warc
使用warc.open(“test.warc.wet”)作为f:
记录在f:
打印(记录['warc-target-uri'],记录[“内容长度])
文档
----
上找到,除了从PIP安装(此版本不适用于此warc3版本)之外,此处描述的
接口保持不变。
许可证
--
是GPL v2授权的。有关详细信息,请参见许可证文件。
…许可证:http://github.com/internetarchive/warc/blob/master/license/master/license
>作者
-
*原始python2版本:
*Anand-Chitipitothu
*Noufal-ibrahim
*Ryan Chartier
*Jan Pieter Br-Br/>*Jan Pieter Br Br-Br/>*Almer S.Tigelaar
br/>更改日志
----
0.2.3
支持在warc中查找/wet
0.2.2
允许wet parse
older…
请参阅https://github.com/internetarchive/warc