Tensorflow：训练数据集中的每一行都包含99%的前一行数据，我可以在运行训练之前对其进行优化吗？

2条回答

网友
1楼 · 编辑于 2024-04-20 15:52:28

如果使用数据API，则可以缓存输入。另外，TF对Kafka的支持可能会对您有所帮助，因为您可以将其建模为数据流。你知道吗
另一种方法是在会话调用之间重用一些数据。然后必须使用资源变量（在当前的Variable()规范中，它意味着在构造函数中使用标志use_resource）。这样你的csv只能包含分钟级别的数据，你只需要把它添加到变量中，从中创建一种循环缓冲区。你知道吗

网友
2楼 · 编辑于 2024-04-20 15:52:28

是的，您可以对此进行设置，以便CSV文件只需要在每行中包含最新的一分钟数据。你知道吗
如果CSV文件每行包含一个数据点，则可以按如下方式创建滑动窗口批处理：
在TF 1.12以后的版本中：
window_size = 180 dataset = tf.data.experimental.CsvDataset(filenames, defaults) dataset = dataset.window(window_size=window_size, shift=1) dataset = dataset.flat_map(lambda x: x.batch(window_size))
例如，如果您有一个包含元素{1, 2, 3, 4, 5, 6, 7, 8, 9, 10}的数据集
# Contains {1, 2, 3, 4, 5, 6, 7, 8, 9, 10} dataset = ... dataset = dataset.window(window_size=3, shift=1) dataset = dataset.flat_map(lambda x: x.batch(3)) it = dataset.make_one_shot_iterator() nxt = it.get_next() with tf.Session() as sess: sess.run(nxt) # [1, 2, 3] sess.run(nxt) # [2, 3, 4] sess.run(nxt) # [3, 4, 5] ...etc...
在TF 1.11及更早版本中：
window_size = 180 dataset = tf.contrib.data.CsvDataset(filenames, defaults) dataset = dataset.apply(tf.contrib.data.sliding_window_batch(window_size=window_size))

相关问题更多 >

编程相关推荐

热门问题

热门文章