索引lzo压缩文件的库

python3-lzo-indexer的Python项目详细描述


https://img.shields.io/pypi/pyversions/python3_lzo_indexer.svghttps://img.shields.io/pypi/v/python3_lzo_indexer.svghttps://coveralls.io/repos/github/Orhideous/python3_lzo_indexer/badge.svg?branch=masterhttps://img.shields.io/travis/Orhideous/python3_lzo_indexer.svghttps://pyup.io/repos/github/Orhideous/python3_lzo_indexer/shield.svg

Python库,用于索引LZO压缩文件中的块偏移量。 实现主要基于Hadoop Library。 索引文件用于允许hadoop拆分压缩的单个文件 将lzo分成几个块进行并行处理。

由于lzo是一种基于块的压缩算法,我们可以分割文件 沿着一排一排的积木,将每个积木单独减压。这个 索引是包含原始块中每个块的字节偏移量的文件 LZO文件。

这个库是python-lzo-indexer的python3 fork。

示例

下面的python代码演示了为lzo文件编制索引是多么容易。 此库还支持对字符串进行索引,以及返回 如果需要创建自己的文件,则需要单独的块偏移 格式。

importlzo_indexerwithopen("my-file.lzo","r")asf,open("my-file.lzo.index","rw")asindex:lzo_indexer.index_lzo_file(f,index)

命令行实用程序

这个库还包括一个用于索引多个多字节文件的实用程序, 使用python索引器。这是比 命令行实用程序内置在hadoop lzo库中,因为它避免了 JVM。

$ lzo_indexer --help

Usage: lzo_indexer [OPTIONS] <files to index>

  Tool for indexing LZO compressed files

Options:
  -t, --threads INTEGER  Processing threads count
  -e, --extension TEXT   Index file extension
  -f, --force            Force re-creation of an index even if it exists
  -h, --help             Show this message and exit.

贡献

我欢迎任何贡献,尽管我要求任何请求 提供测试覆盖率。

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java是否存在这样一种场景:Java7的Hashmap实现优于Java8的实现   java如何打印这些完整的数组?   java BuildException:未能执行aapt   java如何使用类。未知类型的集合返回的cast()   java准备语句返回错误的值   webview 安卓中的java显示身份验证对话框   java如何重命名列名JPA Hibernate   java查询从特定用户和特定时间段的Oracle表(通过比较原始表和备份表)中选择修改的行   java Youtube视频仅在三星S6设备上加载时自动暂停   未调用java RecyclerView getItemViewType   使用JSch setCommand执行带有源选项的java Shell ping命令时失败   java Hibernate:无法删除|删除分离的实例   Java Spring@MappedSuperclass字段作为子类中的@Id字段   java Android:确定单击了哪个按钮,因为该按钮未在xml中定义   如何计算java阵列内存使用率   使用Java查找按字母顺序排列的第一个字符串   javascript注销功能刷新页面,但页面仍已登录   当接口作为参数提供时,java依赖项注入不起作用   java中带原语的字符串扭曲