2024-04-18 12:35:26 发布
网友
由于目前没有简单的方法来分析TensorFlow操作(Can I measure the execution time of individual operations with TensorFlow?),有没有人能帮助我理解使用段操作(例如segment_sum)相对于在预段张量上使用多个操作的好处?segment_sum会比使用dynamic_partition或gather后跟多个reduce_sum更有效吗?segment_sum是否同样可并行?你知道吗
segment_sum
dynamic_partition
gather
reduce_sum
我更新了您链接到的SO问题,提供了一些有关CPU推断分析工具的信息,我们最近发布于: https://github.com/tensorflow/tensorflow/tree/master/tensorflow/tools/benchmark
不幸的是,整个问题很难回答,因为它取决于:
不管你是专注于训练还是推理。
如果你使用的是GPU,如果是的话是什么类型,有多少个。
不管你是在跑步。
您的数据是什么样子的,瓶颈在哪里。
我通常最后要做的是构建代表我正在考虑的操作类型的小的子图,然后计算它们对我将要输入的数据类型所花费的时间。我知道这并不是很有帮助,因为实验可能很耗时,但这是直观地了解适合您特定情况的最佳解决方案的最佳方法。你知道吗
我更新了您链接到的SO问题,提供了一些有关CPU推断分析工具的信息,我们最近发布于: https://github.com/tensorflow/tensorflow/tree/master/tensorflow/tools/benchmark
不幸的是,整个问题很难回答,因为它取决于:
不管你是专注于训练还是推理。
如果你使用的是GPU,如果是的话是什么类型,有多少个。
不管你是在跑步。
您的数据是什么样子的,瓶颈在哪里。
我通常最后要做的是构建代表我正在考虑的操作类型的小的子图,然后计算它们对我将要输入的数据类型所花费的时间。我知道这并不是很有帮助,因为实验可能很耗时,但这是直观地了解适合您特定情况的最佳解决方案的最佳方法。你知道吗
相关问题 更多 >
编程相关推荐