适应蟒蛇3型的达塔马兰蟒蛇叉

dm-pybloom的Python项目详细描述



dm_pybloom
==

图片::https://travis-ci.org/jaybaird/python-bloomfilter.svg?branch=master
:target:https://travis ci.org/jaybaird/python bloom filter

``dm_pybloom``是一个模块,它包括bloom过滤器数据结构以及
可伸缩bloom过滤器的实现,如:

p.almeida,c.baquero,n.pregui_a,d.hutchison,可伸缩bloom过滤器,
(globecom 2007),ieee,2007年。

bloom filters非常棒,如果您了解需要提前将
的位设置到一边以存储整个集的话。可伸缩的bloom过滤器允许bloom
过滤器位随着假阳性概率和大小的函数而增长。

a filter is“full”when at capacity:m*((ln 2^2)/abs(ln p)),其中m
是位的数量,p是假阳性概率。当达到容量
时,将创建一个比上一个
指数大的新过滤器,具有更高的误报概率和更多的散列函数。

代码块::python

>;>from dm_pybloom import bloomfilter
>;>f=bloomfilter(容量=1000,错误率=0.001)
>;[f.add(x)for x in range(10)]
[false,false,false,false,false,false,false,false,false,false,false,false,false,false,false,false,false,false]
>;>全部([(x in f)表示x in range(10)])
true
>;>10 in f
false
>;>5 in f
true
>;>f=bloomfilter(容量=1000,错误率=0.001)
>;>i in x range(0,f.容量):
…_=f.add(i)
>;>;(1.0-(len(f)/float(f.capacity))<;=f.error_rate+2e-18
true

>;>;来自dm_pybloom import scalablebloomfilter
>;>;sbf=scalablebloomfilter(mode=scalablebloomfilter.small_set_growth)
>;count=10000
>;>;对于x范围(0,计数):
…_=sbf.add(i)

>;>1.0-(len(sbf)/float(count))<;=sbf.error_rate+2e-18
true


len(sbf)可能不等于整个输入长度。0.01%的误差小于默认的0.1%误差阈值。随着容量的增加,
误差将接近0.1%。



欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
Java泛型和基类   ProcessBuilder或DefaultExecutor启动的“RunAs”子进程的java读取标准输出   java应用程序在尝试登录时突然停止   Java:神秘的Java未捕获异常处理程序[带代码]   java JavaFX NumberAxis自动范围无限循环   最新版本和旧版本冲突的java双Maven依赖关系   java如何导入带有部署变量类名的静态函数?   编译器构造不同的JDK更新会产生不同的Java字节码吗?   java无法在struts 1.1中上载任何超过250 MB大小的文件   java调整jcombobox下拉菜单的宽度   java如何在某些情况下忽略@SQLDelete注释   在Eclipse for Java EE developers edition中禁用HTML警告   java HttpUrlConnection重置请求属性   java@Provider资源未在rest应用程序中注册   java TOP N使用JPA连接   java在使用反射调用方法时区分int和Integer参数