数据库匿名程序包
pganonymizer的Python项目详细描述
pganonymizer
pganonymizer是一个用于测试的匿名化数据库的工具。
安装
pganonymizer要求运行python 3.5及更高版本。可以使用pip安装pganonymizer。
$ pip install pganonymizer
背景
pganonymizer将根据csj文件中的规则哈希表中的列。
CSJ文件格式:
"table", "column", "rule"
"schema.table_to_be_hased", "columned_to_be_hased", "hash"
"schema.table_to_be_hased", "columned_to_be_hased", "date"
"schema.table_to_be_hased", "columned_to_be_hased", "phone"
散列规则示例
Hash
用于文本类型字段,如名称或地址。返回值以base32为单位,长度为atmost 16。
输入示例:
Customer1
示例输出:
EC35FEOXDMVR7Y5C
Date
用于日期类型字段。返回值将保留原始年份,但散列月份和日期字段。
输入示例:
2000-12-15
示例输出:
2000-01-10
Phone
表示电话号码。返回值的长度将与原始数字相同。
输入示例:
+66932019385
示例输出:
+66254818000
说明
格式:
$ pganonymizer [database environment][option]
要使用pganonymizer,您可以致电:
$ pganonymizer --schema path_to_schema_file.csj
默认情况下,pganonymizer将使用用户的用户名作为数据库和角色连接到数据库。
否则,请指定如下:
$ pganonymizer -d postgres -U postgres --schema path_to_schema_file.csj
有关用法的详细信息,请使用以下命令:
$ pganonymizer --help