一种快速简单的支持压缩的概率bloom滤波器
fastBloomFilter的Python项目详细描述
#简单快速的pythonic bloom filter
来自wikipedia:“bloomfilter是一种空间效率高的概率数据结构,由burton howard bloom于1970年提出,用于测试元素是否是集合的成员。假阳性匹配是可能的,但假阴性是不可能的——换句话说,查询返回“可能在集合中”或“绝对不在集合中”。元素可以添加到集合中,但不能删除(虽然这可以通过“计数”过滤器处理);添加到集合中的元素越多,误报的概率就越大。”
此过滤器支持:
zlib>;bz2>;lzma
用于解压缩:lzma>;bz2>;zlib>;lzo>;lz4
统计信息
熵分析
数据的内部和外部散列。
原始筛选器合并
安装:
sudo pip安装fastbloomfilter
bloom筛选器文件的外部创建:
导入:
bf.update('1’)true
>printbf.update('2’)false
>printbf.update('2’)
>prinbf.query打印查询('1');true
print bf.query('1230213')。#true
打印bf.query('12')false
来自wikipedia:“bloomfilter是一种空间效率高的概率数据结构,由burton howard bloom于1970年提出,用于测试元素是否是集合的成员。假阳性匹配是可能的,但假阴性是不可能的——换句话说,查询返回“可能在集合中”或“绝对不在集合中”。元素可以添加到集合中,但不能删除(虽然这可以通过“计数”过滤器处理);添加到集合中的元素越多,误报的概率就越大。”
此过滤器支持:
zlib>;bz2>;lzma
用于解压缩:lzma>;bz2>;zlib>;lzo>;lz4
统计信息
熵分析
数据的内部和外部散列。
原始筛选器合并
安装:
sudo pip安装fastbloomfilter
bloom筛选器文件的外部创建:
导入:
bf.update('1’)true
>printbf.update('2’)false
>printbf.update('2’)
>prinbf.query打印查询('1');true
print bf.query('1230213')。#true
打印bf.query('12')false