tensorflow数据预处理库

tensorflow-transform的Python项目详细描述


张量流变换

PythonPyPIDocumentation

tensorflow transform是一个用tensorflow预处理数据的库。 tf.Transform对于需要全通的数据非常有用,例如:

  • 通过平均值和标准偏差对输入值进行标准化。
  • 通过对所有输入值生成词汇表,将字符串转换为整数。
  • 通过根据观察到的值将浮点数赋给存储桶,将浮点数转换为整数 数据分发。

TensorFlow内置了对单个示例或批处理操作的支持 例如。tf.Transform扩展这些功能以支持完整的传递 在示例数据上。

tf.Transform的输出导出为 TensorFlow graph用于训练和服务。 在训练和发球中使用相同的图形可以防止倾斜,因为 两个阶段都应用相同的转换。

有关tf.Transform的介绍,请参见 tfx开发人员峰会谈tfx (link)。

注意:tf.Transform在版本1.0之前可能向后不兼容。

安装

这个tensorflow-transformPyPI package是 建议的安装方式tf.Transform

pip install tensorflow-transform

依赖性

tf.Transform需要tensorflow,但不依赖于tensorflowPyPI package。见 TensorFlow install guides用于 说明。

Apache Beam是运行分布式分析所必需的。 默认情况下,apache beam在本地模式下运行,但也可以在分布式模式下运行 使用Google Cloud Dataflowtf.Transform设计为可扩展到其他apache束流运行程序。

兼容版本

下表是tf.Transform包版本 相互兼容。这是由我们的测试框架决定的,但是 其他未经测试的组合也可以工作。

tensorflow-transformtensorflowapache-beam[gcp]
GitHub masternightly (1.x)2.14.0
0.14.01.142.14.0
0.13.01.132.11.0
0.12.01.122.10.0
0.11.01.112.8.0
0.9.01.92.6.0
0.8.01.82.5.0
0.6.01.62.4.0
0.5.01.52.3.0
0.4.01.42.2.0
0.3.11.32.1.1
0.3.01.32.1.1
0.1.101.02.0.0

问题

请将有关使用tf.Transform的任何问题定向到 Stack Overflow使用 tensorflow-transform 标签。

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
junit cucumber为什么会找到“runTest.java”来运行测试?   在Eclipse中找不到java KeyPairGenerator   java NotSerializableException即使在实现Serializable之后   noclassdeffounderror(java字符串连接)为什么会出现这种异常?   java Guice:将接口绑定到由动态代理创建的实例   使用Spring数据neo4j创建空间索引时发生java错误   java对于需要在50多个excel文件上运行并且每个文件平均包含25k行的项目,最佳的方法是什么   javaNIO中的java缓冲区写入/发送消息问题   如何在Java/eclipse中添加不调用super()的警告   JavaSpring:mvcUrl映射错误的id   java应该在getInstance或构造函数中使用Init方法吗?   安卓中的java空指针异常错误   java Jsoup不能完全获取原始html代码