TensorFlow：从RNN中获取所有状态

2条回答

网友

1楼 · 编辑于 2024-05-15 15:29:47

我已经创建了一个PR here，它可能会帮助您处理简单的案例

让我简单地解释一下我的实现，这样您就可以根据需要编写自己的版本。主要是修改_time_step函数：

def _time_step(time, output_ta_t, state, *args):

除了传入额外的*args，参数保持不变。但是为什么args？因为我想支持tensorflow的习惯行为。您只能通过忽略args参数返回最终状态：

^{pr2}$

如何利用它？在

if args:
    args = tuple(
        ta.write(time, out) for ta, out in zip(args[0], [new_state])
    )

实际上，这只是对以下（原始）代码的修改：

output_ta_t = tuple(
    ta.write(time, out) for ta, out in zip(output_ta_t, output)
)

现在，args应该包含您想要的所有状态。在

完成以上所有工作后，您可以使用以下代码获取状态（或最终状态）：

_, output_final_ta, *state_info = control_flow_ops.while_loop( ...

以及

if states_ta is not None:
    final_state, states_final_ta = state_info
else:
    final_state, states_final_ta = state_info[0], None

虽然我没有在复杂的情况下测试它，但它应该在“简单”的条件下工作（here's我的测试用例）

网友

2楼 · 编辑于 2024-05-15 15:29:47

在tf.nn.动态（同时tf.nn.静态)有两个返回值；“outputs”，“state”（https://www.tensorflow.org/api_docs/python/tf/nn/dynamic_rnn）

正如您所说，“state”是RNN的最终状态，但是“outputs”都是RNN的隐藏状态（形状是[batch\u size，max_time，cell.output_大小])在

您可以使用“outputs”作为RNN的隐藏状态，因为在大多数库提供的RNNCell中，“output”和“state”是相同的。（LSTMCell除外）