用于内存基数计算的小型库。
pyhll的Python项目详细描述
CI状态:
pyhll可用于计算基数,即使用hyperloglog计算某些集合中元素的唯一数目。 这个库是在https://raw.github.com/armon/hlld
安装
pyhll可以通过pypi安装:
pip install pyhll
建筑
获取源:
git clone https://github.com/blackwithwhite666/pyhll.git
编译扩展名:
python setup.py build_ext --inplace
用法
from pyhll import Cardinality c = Cardinality() c.add(b'foo') assert 1 == len(c) c.add(b'bar') assert 2 == len(c) c.add(b'bar') assert 2 == len(c) c.update([b'bar', b'buzz']) assert 3 == len(c)
运行测试套件
使用tox运行测试套件:
tox
参考文献
以下是一些相关的工作,我们可以利用:
- 实践中的超对数:最新基数估计算法的算法工程:http://research.google.com/pubs/pub40671.html
- hyperloglog:近似最优基数估计算法分析:http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.142.9475
更改日志
0.2.4
- 添加转储和加载支持;
0.2.3
- 添加对fluent iface的支持;
0.2.1-0.2.2
- 在CentOS上修复构建;
0.2.0
- 为并集添加功能;
- 添加序列化支持;
0.1.1
- 从sdist中排除autoconf工件。
0.1.0(初始释放)
- 原型。