用于DQN强化学习的Keras Tensorboard

2024-04-25 00:10:23 发布

您现在位置:Python中文网/ 问答频道 /正文

我使用keras来构建一个DQN,并用一个具有经验回放内存的经典DQN算法训练它。因为在dqn你需要打电话模型.拟合很多次,这意味着每次从重播内存中采样批数据时,每次使用keras'model.fit( .... callbacks=TensorBoard(...))时,都会生成新的事件日志文件。它产生了两个问题,首先它生成了太多太多的事件日志文件,减慢了训练的速度,而且在Tensorboard中你看不到任何趋势,例如损失的逐渐减少。在

在强化学习,特别是DQN的实施过程中,如何可视化训练过程,如观察梯度和激活的变化?在


Tags: 文件数据内存模型算法model过程dqn
1条回答
网友
1楼 · 发布于 2024-04-25 00:10:23

您可以通过TensorFlow:

# Create FileWriter
file_writer = tf.summary.FileWriter(log_dir, tf.get_default_graph())
history = model.fit(state, Q_values, epochs=1, verbose=0)
loss = history.history['loss'][0]

# Add values to Tensorboard
training_summary = tf.Summary(value=[tf.Summary.Value(tag="loss", simple_value=loss),
                                     tf.Summary.Value(tag="score", simple_value=score)])
file_writer.add_summary(training_summary, global_step=total_frames)

相关问题 更多 >