管理Google云数据目录文件集脚本的包

datacatalog-fileset-processor的Python项目详细描述


数据目录文件集处理器

CircleCIPyPiLicenseIssues

管理Google云数据目录文件集脚本的包。在

免责声明:这不是官方支持的谷歌产品。

目录


在云Shell中执行

# Set your SERVICE ACCOUNT, for instructions go to 1.3. Auth credentials# This name is just a suggestion, feel free to name it following your naming conventionsexportGOOGLE_APPLICATION_CREDENTIALS=~/datacatalog-fileset-processor-sa.json

# Install datacatalog-fileset-processor
pip3 install datacatalog-fileset-processor --user

# Add to your PATHexportPATH=~/.local/bin:$PATH# Look for available commands
datacatalog-fileset-processor --help

1。环境设置

1.1条。Python+virtualenv

使用virtualenv是可选的,但强烈建议您除非使用Docker。在

1.1.1。安装Python 3.6+

1.1.2。获取源代码

^{pr2}$

下一步中以./开头的所有路径都是相对于datacatalog-fileset-processor 文件夹。

1.1.3。创建并激活一个独立的Python环境

pip install --upgrade virtualenv
python3 -m virtualenv --python python3 env
source ./env/bin/activate

1.1.4。安装软件包

pip install --upgrade .

1.2条。Docker

Docker可以作为运行脚本的替代方法。在这种情况下,请忽略 Virtualenv安装说明。在

1.3条。身份验证凭据

1.3.1。创建服务帐户并授予其以下角色

  • 数据目录管理员

1.3.2。下载一个JSON密钥并将其另存为

此名称只是一个建议,请按照您的命名约定随意命名

  • ./credentials/datacatalog-fileset-processor-sa.json

1.3.3。设置环境变量

如果使用Docker,则可以跳过此步骤。

exportGOOGLE_APPLICATION_CREDENTIALS=~/credentials/datacatalog-fileset-processor-sa.json

2。从CSV文件创建文件集

2.1条。创建一个CSV文件,表示要创建的条目组和条目

文件集由表示其所有字段所需的任意多行组成。列是 描述如下:

ColumnDescriptionMandatory
entry_group_nameEntry Group Name.Y
entry_group_display_nameEntry Group Display Name.N
entry_group_descriptionEntry Group Description.N
entry_idEntry ID.Y
entry_display_nameEntry Display Name.Y
entry_descriptionEntry Description.N
entry_file_patternsEntry File Patterns.Y
schema_column_nameSchema column name.N
schema_column_typeSchema column type.N
schema_column_descriptionSchema column description.N
schema_column_modeSchema column mode.N

请注意,schema_column_type是一个开放的字符串字段,如果需要,可以接受任何内容 要将文件集与数据流SQL一起使用,请遵循official docs中的数据类型。在

2.2条。运行datacatalog fileset processor脚本-创建文件集条目组和条目

  • Python+virtualenv
datacatalog-fileset-processor filesets create --csv-file CSV_FILE_PATH

2.3条。运行datacatalog fileset processor脚本-删除Filesets条目组和条目

  • Python+virtualenv
datacatalog-fileset-processor filesets delete --csv-file CSV_FILE_PATH

TIPS

历史

0.1.0(2020-04-24)

  • PyPI的第一个版本。在

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java调用Python函数作为TEID中的UDF   java Android。支持v4导入不工作   java如何影响具有静态属性的类   java如何在从glTexImage2D()分配后编辑纹理的像素颜色   javaspringboot+rediscache+@Cacheable适用于某些方法,而不适用于其他方法   java无法将动态Web模块方面从3.0更改为2.5   java如何在新选项卡中显示打印的文档?   java Google Cloud Endpoints API方法仅在删除用户参数时成功调用   java为什么我可以使用Stack<Double>但不能使用Stack<Double>?   java JDBC PreparedStatement似乎忽略了占位符   java如何设置JInternalFrame的标准图标化位置?   Java文件。copy()不复制文件   基于另一个类的java显示arraylist?   java Android Studio:错误:非法字符:'\u2028'   对象(Java)无法实例化类型映像?   javascript错误:飞行前响应的HTTP状态代码401无效   java确保泛型vararg参数具有相同的类型