基于位域的cython快速数集

sparsebitfield的Python项目详细描述


sparsebitfield

这是一个https://github.com/stestagg/bitfield的叉子 适用于稀疏的位场和大量的数据。这个 api是相同的,但是对python 2的支持已经被放弃。

警告:序列化机制目前不可移植。

安装

$ sudo pip3 install sparsebitfield

用法

>>>importsparsebitfield>>>field=sparsebitfield.SparseBitfield()>>>field.add(100)>>>print(list(field))[100]>>>second=sparsebitfield.SparseBitfield([2,100])>>>list(field|second)[2,100]>>>second.add(10000)>>>second.pickle()b'BZ:x\x9c\xed\xce\xc1\t\x00\x0c\x04\xb0+8@\xf7\x9f\xd6\x87\x0f7P(\xc9\x04I\x8eZ\xb9:\x00\x93\xd4\xef\x00\x00\x00\x00\x00\x00\x00<\xb3\x01\xda\x86\x00\x17'>>>importrandom>>>large=sparsebitfield.SparseBitfield(random.sample(range(1000000),500000))# 500,000 items, randomly distributed>>>len(large)500000>>>len(large.pickle())125269# 122KB>>>large=sparsebitfield.SparseBitfield(range(1000000))# 1 million items, all sequential>>>len(large)1000000>>>len(large.pickle())69# <100 bytes

稀疏位字段支持大多数与常规集相同的操作/用法, 有关示例,请参见测试。

设计

sparsebitfield被设计用来有效地处理跟踪大型项目集。

主要设计目标是:

  • 节省空间的序列化格式
  • 快速的成员资格测试和设置差异
  • 大稀疏位域的空间效率处理
  • 支持大整数(>;2**64)

在内部,sparsebitfield通过使用1-d位图分割成 页。这些页面按排序列表进行组织。

在一页中,一个数字通过设置记录在集合中 第n位是1。即集合([1])被记录为…00000010b,而 集合([1,4])将是…00010010b。

如果特定页为空(该范围内没有集合成员)或已满,则 位字段将被丢弃,并由空标志或完整标志表示。页 这本书并不是为了不占用任何记忆而写的。也是空的 pickled数据中不包括页。

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java Android Action_Edit Intent无法像以前一样调用App Gallery来编辑图片   确保JRE兼容性的java适当程序(32或64位)   java JSONArray。for循环中的add(JSONObject)正在替换for循环中的旧值,数组由循环中的最后一个值组成   java需要帮助创建一个返回数组的方法,该数组的元素是另一个数组的平方   使用SmbFile w/groovy XmlSluper()创建xml。解析()Java   检查大小后的java ArrayIndexOutOfBoundsException   乘法表中的第k个最小元素   java 401 on请求,其中指定了'permitAll()'   java如何附加ORC文件   java hibernate类模型   java IDEA没有看到由自定义注释处理器生成的方法   Servlet中未声明java SerialVersionId   java linkedlist到达列表末尾时   java如何正确对齐EditText光标?   java 6编译器1.6上的eclipse重写方法错误   java如何在基于Jersey的RESTful Web服务中读取post数据   java如何在活动中正确使用接口?   Java的JIT编译器的工作速度有多快?