机制是什么tf.data.dataset.洗牌？ - 问答 - Python中文网

机制是什么tf.data.dataset.洗牌？

2024-04-19 02:38:56 发布

您现在位置：Python中文网/ 问答频道 /正文

男 | 程序猿一只，喜欢编程写python代码。

假设我在一个tfrecord中有100000个示例。我用缓冲区大小100做一次随机播放，它会每100个例子洗牌一次，在我们消耗完所有的例子之后，再画100个例子到shuffle中。或者，当我们使用训练数据时，它也会填充后面的示例，并从洗牌中统一提取，这样在某个时间点，每个示例都有一定的概率在缓冲区中？在

它认为后者更有意义。洗牌功能是如何实现的吗？我查了一下，找到了解释这个机制的来源。在

谢谢。在

Tags：数据功能示例 tfrecord 时间来源概率机制

1条回答

网友

1楼 · 发布于 2024-04-19 02:38:56

取自here

The Dataset.shuffle()transformation randomly shuffles the input dataset using a similar algorithm to tf.RandomShuffleQueue: it maintains a fixed-size buffer and chooses the next element uniformly at random from that buffer.

您可以找到操作here的定义，它指向^{}。在

此外，请注意，shuffle操作还允许您确定如何绘制批处理（即，在一个epoch之后，数据集是否总共是伪随机随机洗牌）。在

相关问题更多 >

编程相关推荐

热门问题

热门文章