实用的完美哈希模块
pph的Python项目详细描述
pph公司
pph为密钥列表生成一个最小保序散列函数。在
参考文献:
实用完美哈希 GV Cormack,RNS Horsool,M Kaiserswerth-计算机杂志,1985年
目录
许可证
此项目在Apache License, Version 2.0下获得许可。在
建筑
这个库使用Boost库。在
export LDFLAGS="$LDFLAGS -L/path/to/boost/lib"
export CPPFLAGS="$CPPFLAGS -I/path/to/boost/include"
pph使用CMake构建系统。在
^{pr2}$使用
从包含字符串列表(每行一个)的文件生成哈希函数的基本命令行是:
pph -i ./file.txt -o ./file.hash
验证现有哈希函数的命令行是:
pph --verify ./file.hash
其他命令行选项可以通过键入以下命令来查看:
pph --help
创建哈希函数的默认超时为60000毫秒(1分钟)。在
如果没有生成哈希函数,可以尝试对输入文件进行排序:
pph -i file.txt --index > file_index.txt
sort --numeric-sort --key=2 file_index.txt > file_sorted_index.txt
awk -F' ' '{print $1}' file_sorted_index.txt > file_sorted.txt
Python
这个库使用Boost库。安装Boost库并在安装Python模块之前设置LDFLAGS和CPPFLAGS。在
export LDFLAGS="$LDFLAGS -L/path/to/boost/lib"
export CPPFLAGS="$CPPFLAGS -I/path/to/boost/include"
安装模块。在
pip3 install pph
导入模块。在
from pph import PphHashTable, PphRandomNumber, PphKeyFunctions
请参阅测试,了解如何使用Python接口生成哈希函数。在
- 项目
标签: