管理Google云数据目录标记的包,从外部源加载元数据

datacatalog-tag-manager的Python项目详细描述


数据目录标记管理器

管理Google云数据目录标记的Python包,从外部加载元数据 消息来源。当前支持CSV文件格式。在

CircleCI

目录

1。环境设置

1.1条。Python+virtualenv

使用virtualenv是可选的,但强烈建议您除非使用Docker。在

1.1.1。安装Python 3.6+

1.1.2。创建文件夹

这是推荐的,这样所有相关的东西将驻留在同一个地方,使它更容易遵循 以下说明。在

mkdir ./datacatalog-tag-manager
cd ./datacatalog-tag-manager

下一步中以./开头的所有路径都是相对于datacatalog-tag-manager 文件夹。

1.1.3。创建并激活一个独立的Python环境

^{pr2}$

1.1.4。安装软件包

pip install --upgrade datacatalog-tag-manager

1.2条。Docker

Docker可以用作运行datacatalog-tag-manager的替代方法。在这种情况下,请 忽略abovevirtualenv安装说明。在

1.2.1。获取源代码

git clone https://github.com/ricardolsmendes/datacatalog-tag-manager
cd ./datacatalog-tag-manager

1.3条。身份验证凭据

1.3.1。创建服务帐户并授予其以下角色

  • BigQuery元数据查看器
  • 数据目录TagTemplate用户
  • 具有bigquery.datasets.updateTagbigquery.tables.updateTag权限的自定义角色
<3.4.1条。下载一个JSON密钥并将其另存为
  • ./credentials/datacatalog-tag-manager.json

1.3.3。设置环境变量

如果使用的是Docker,则可以跳过此步骤。

exportGOOGLE_APPLICATION_CREDENTIALS=./credentials/datacatalog-tag-manager.json

2。管理标记

2.1条。创建或更新

创建或更新标记的元数据架构如下所述。根据需要使用多行 描述您需要的所有标记和字段。在

ColumnDescriptionMandatory
linked_resource OR entry_nameFull name of the BigQuery or PubSub asset the Entry refers to, or an Entry name if you are working with Custom Entriesyes
template_nameResource name of the Tag Template for the Tagyes
columnAttach Tags to a column belonging to the Entry schemano
field_idId of the Tag fieldyes
field_valueValue of the Tag fieldyes

TIPS

2.1.1。从CSV文件

  • Python+virtualenv
datacatalog-tags upsert --csv-file CSV_FILE_PATH
  • 码头工人
docker build --rm --tag datacatalog-tag-manager .
docker run --rm --tty \
  --volume CREDENTIALS_FILE_FOLDER:/credentials --volume CSV_FILE_FOLDER:/data \
  datacatalog-tag-manager upsert --csv-file /data/CSV_FILE_NAME

2.2条。删除

删除标记的元数据模式如下所述。根据需要使用尽可能多的行来删除所有 你想要的标签。在

^{tb2}$

TIPS

2.2.1。从CSV文件

  • Python+virtualenv
datacatalog-tags delete --csv-file CSV_FILE_PATH
  • 码头工人
docker build --rm --tag datacatalog-tag-manager .
docker run --rm --tty \
  --volume CREDENTIALS_FILE_FOLDER:/credentials --volume CSV_FILE_FOLDER:/data \
  datacatalog-tag-manager delete --csv-file /data/CSV_FILE_NAME

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java web爬虫:使用selenium+webdriver遍历页面链接时出现两种异常   java JPA和SYS_REFCURSOR-like OUT参数   非空参数的java方法引用?   xml中的java子节点名称   java为什么GC不在同一个方法中运行   java如何检查可执行JAR是否已在另一个JVM中完成   将外观更改为Nimbus后出现jtable Java错误   用户界面Java Swing架构问题?   java导入自定义字体时我做错了什么?   java如何用API制作可伸缩的游戏策划   java玩家和方块的碰撞和交集   java增强的for循环   java propertiesmavenplugin不适用于目标writeprojectproperties   java循环返回代码的开头   java使用分号执行apachecommonsexec多个命令   Wicket应用程序中的java全局可访问资源   java在eclipse中设置参数时可以使用类名而不是id吗?   eternal和maxElementsInMemory在ehcache中的java角色?   java ClassCastException在同一个ear中从两个不同的WAR加载同一个类时,由于类装入器不同