创建和管理warc文件。目前正处于计划/α前阶段。

BASC-WARC的Python项目详细描述


Bibliotheca Anonoma’s用于创建和管理warc文件的库。

这个库处于计划/前期alpha阶段。它仍在编写中,目前还不适合任何实际使用。当我们还在编写和设计api时,任何事情都可以在没有任何通知的情况下更改。

我们很感激pull请求,但是由于开发的早期阶段,您可能需要在我们更新项目代码时彻底检查您的pr。

此库主要是为BASC-Archiver编写的,并计划集成到新的/现有的下载库中。

Hosted Documentation

计划功能

  • python 2/3兼容性。
  • 线程安全。
  • 流式读/写warc文件,用于在内存量较小的系统上处理非常大的文件。
  • cdx文件的创建和管理。
  • 包含的脚本可以完成有用的工作,可能允许从warcs查看或提取信息和文件/附加warcs/从warcs创建cdx文件,类似于megawarcCDX-Writerwarctools

许可证

Daniel Oaks于2015年撰写的daniel@danieloaks.net>;

在法律允许的范围内,作者已将本软件的所有版权及相关和邻近权利专用于全球公共领域。本软件不作任何保证。

您应该已经收到一份cc0公共域专用文件的副本以及此软件。如果没有,请参阅http://creativecommons.org/publicdomain/zero/1.0/

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
JavaSpringMVC控制器测试打印结果JSON字符串   若catch语句返回,那个么为什么它最终会阻塞呢?   java Grails中servletContext在哪里可用?   java Jhipster:如何为现有项目启用多种语言   java异常评估SpringEL表达式:“#fields.hasErrors('something')”   java如何验证SeleniumWebDriver中的文本颜色?   java在绘图时使用JPanel坐标   java如何初始化spring启动到project?   java如何通过JDBC的PreparedStatement将UUID数组插入HyperSQL数据库   java修改JVM以跨线程序列化文件访问   Javascript到Java正则表达式   使用Java运行时调用aspell程序时出现字符集问题。getRuntime()。执行官   执行RDP时的java Sukuli按钮识别   java如何使用okhttp更改connect请求的标头   java无法创建Maven Eclipse项目