Tensorflow内存管理分块？

x = tf.constant(X[:,0], shape=[X.shape[0],1]) y = tf.constant(X[:,1], shape=[X.shape[0],1]) dx = x - tf.transpose(x) dy = y - tf.transpose(y) D = tf.sqrt(dx*dx + dy*dy) M = 0.1 * 5.0 / tf.pow(4.0 + D, 1.5) res = tf.reduce_sum(betaM)

1条回答

网友

1楼 · 发布于 2024-04-18 22:16:35

这里真正需要（但尚未实现）的是cwise融合。现在的情况是，2*sqrt(a+b)将为a+b分配新的张量，然后为sqrt分配新的张量，然后为2*sqrt分配另一个张量。PS，您可以通过检查内存分配messages（需要verbose logging）来挖掘内存的去向

通过使用变量和assign_add递增地更新内容而不需要创建许多中间张量，可以提高内存效率。有一个计算“所有成对距离”here的替代公式，它可能更容易转换成这种形式

编程相关推荐

使用HQL查询的java Hibernate批更新
java AutoWiring steps与Spring Cucumber Serenity
JavaSpring启动测试用例不会加载所有组件
java RMI运行时何时断开客户端连接？
如果xml文件中缺少元素，如何在java中通过jaxb解组为该元素设置默认值
Mule3.9.0Java。util。ConcurrentModificationException:null
更改Java web服务响应的标头，而不进行Jackson转换
java在选择NEtbeans中的主类时存在歧义，尽管声明了公共类
java jawampa最大WebSock框架尺寸？
安卓安卓x中定义的java add（）。碎片应用程序。零碎交易

相关问题更多 >

编程相关推荐

热门问题

热门文章

Tensorflow内存管理分块？

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >