单段操作与多段操作的性能比较

2024-04-18 12:35:26 发布

您现在位置:Python中文网/ 问答频道 /正文

由于目前没有简单的方法来分析TensorFlow操作(Can I measure the execution time of individual operations with TensorFlow?),有没有人能帮助我理解使用段操作(例如segment_sum)相对于在预段张量上使用多个操作的好处?segment_sum会比使用dynamic_partitiongather后跟多个reduce_sum更有效吗?segment_sum是否同样可并行?你知道吗


Tags: ofthe方法timetensorflowwithsegmentcan
1条回答
网友
1楼 · 发布于 2024-04-18 12:35:26

我更新了您链接到的SO问题,提供了一些有关CPU推断分析工具的信息,我们最近发布于: https://github.com/tensorflow/tensorflow/tree/master/tensorflow/tools/benchmark

不幸的是,整个问题很难回答,因为它取决于:

  • 不管你是专注于训练还是推理。

  • 如果你使用的是GPU,如果是的话是什么类型,有多少个。

  • 不管你是在跑步。

  • 您的数据是什么样子的,瓶颈在哪里。

我通常最后要做的是构建代表我正在考虑的操作类型的小的子图,然后计算它们对我将要输入的数据类型所花费的时间。我知道这并不是很有帮助,因为实验可能很耗时,但这是直观地了解适合您特定情况的最佳解决方案的最佳方法。你知道吗

相关问题 更多 >