tensorflow数据预处理库
tensorflow-transform的Python项目详细描述
张量流变换
tensorflow transform是一个用tensorflow预处理数据的库。
tf.Transform
对于需要全通的数据非常有用,例如:
- 通过平均值和标准偏差对输入值进行标准化。
- 通过对所有输入值生成词汇表,将字符串转换为整数。
- 通过根据观察到的值将浮点数赋给存储桶,将浮点数转换为整数 数据分发。
TensorFlow内置了对单个示例或批处理操作的支持
例如。tf.Transform
扩展这些功能以支持完整的传递
在示例数据上。
tf.Transform
的输出导出为
TensorFlow graph用于训练和服务。
在训练和发球中使用相同的图形可以防止倾斜,因为
两个阶段都应用相同的转换。
有关tf.Transform
的介绍,请参见
tfx开发人员峰会谈tfx
(link)。
注意:tf.Transform
在版本1.0之前可能向后不兼容。
安装
这个tensorflow-transform
PyPI package是
建议的安装方式tf.Transform
:
pip install tensorflow-transform
依赖性
tf.Transform
需要tensorflow,但不依赖于tensorflow
PyPI package。见
TensorFlow install guides用于
说明。
Apache Beam是运行分布式分析所必需的。
默认情况下,apache beam在本地模式下运行,但也可以在分布式模式下运行
使用Google Cloud Dataflow。
tf.Transform
设计为可扩展到其他apache束流运行程序。
兼容版本
下表是tf.Transform
包版本
相互兼容。这是由我们的测试框架决定的,但是
其他未经测试的组合也可以工作。
tensorflow-transform | tensorflow | apache-beam[gcp] |
---|---|---|
GitHub master | nightly (1.x) | 2.14.0 |
0.14.0 | 1.14 | 2.14.0 |
0.13.0 | 1.13 | 2.11.0 |
0.12.0 | 1.12 | 2.10.0 |
0.11.0 | 1.11 | 2.8.0 |
0.9.0 | 1.9 | 2.6.0 |
0.8.0 | 1.8 | 2.5.0 |
0.6.0 | 1.6 | 2.4.0 |
0.5.0 | 1.5 | 2.3.0 |
0.4.0 | 1.4 | 2.2.0 |
0.3.1 | 1.3 | 2.1.1 |
0.3.0 | 1.3 | 2.1.1 |
0.1.10 | 1.0 | 2.0.0 |
问题
请将有关使用tf.Transform
的任何问题定向到
Stack Overflow使用
tensorflow-transform
标签。