用于创建带有伪敏感数据的BQ表的库
bq-fake-pii-table-creator的Python项目详细描述
bq逯假趵pii逯表逯创建者
用于使用伪pii数据创建BQ表的库。在
创建这个库的驱动和用例是在您需要大量数据来验证您的组织是否符合以下法规的时候 CCPA、HIPAA、GDPR。在
1。环境设置
1.1条。获取代码
git clone https://.../bq_fake_pii_table_creator.git
cd bq_fake_pii_table_creator
1.2条。身份验证凭据
1.2.1。创建服务帐户并授予其以下角色
经过身份验证的服务帐户必须具有云存储和BigQuery的管理员权限。在
<2.2.1。下载一个JSON密钥并将其另存为<YOUR-CREDENTIALS_FILES_FOLDER>/bq_fake_pii_table_creator-credentials.json
Please notice this folder and file will be required in next steps.
1.3条。虚拟环境
使用virtualenv是可选的,但强烈建议您除非使用Docker或PEX文件。在
1.3.1。安装Python 3.6+
1.3.2。创建并激活virtualenv
^{pr2}$1.3.3。安装依赖项
pip install --editable .
1.3.4。设置环境变量
根据您的环境替换以下值:
exportGOOGLE_APPLICATION_CREDENTIALS=credentials_file_path
1.4条。Docker
请参阅下面的说明。在
2。示例应用程序入口点
2.1条。跑主.py
- 虚拟人
只需要project id参数。在
python main.py --project-id your_project --bq-dataset-name your_dataset --bq-table-name your_table --num-rows 5000 --num-cols 10 --obfuscate-col-names true
2.2条。或使用Docker
docker build -t bq_fake_pii_table_creator . docker run --rm --tty -v CREDENTIALS_FILES_FOLDER:/data \ bq_fake_pii_table_creator \ --project-id your_project
历史
0.0.1(2020-04-30)
- PyPI的第一个版本。在
- 项目
标签: