Tensorflow 1.11.0在尝试使用范围.可重用性()

tf.reset_default_graph() def create_model(): return tf.contrib.cudnn_rnn.CudnnGRU(num_layers=1, num_units=100, direction='unidirectional') # (time, batch_size, num_inputs) x = tf.random_normal((100, 16, 100)) with tf.variable_scope('model') as scope: model_1 = create_model() rnn_out_1, rnn_state_1 = model_1(x) scope.reuse_variables() model_2 = create_model() rnn_out_2, rnn_state_2 = model_2(x)

1条回答

网友

1楼 · 发布于 2024-05-15 02:18:40

CudnnGRU看起来像keras风格的模型对象。所以你应该重用这个对象在层之间共享参数，比如

def create_model():
    return tf.contrib.cudnn_rnn.CudnnGRU(num_layers=1, num_units=100,
                                  direction='unidirectional')


# (time, batch_size, num_inputs)
x = tf.random_normal((100, 16, 100))

model = create_model()
rnn_out_1, rnn_state_1 = model(x)
rnn_out_2, rnn_state_2 = model(x)

我不知道为什么只有第二条路是正确的。在

编辑

我发现CudnnGRU在其当前变量范围内为其变量指定唯一的变量名。在

第一种方法是model_2使用一个新名称，比如cudn_gru__1，使其名称独一无二。另一方面，在第二种方法中，您创建了一个新的变量范围，因此模型2的唯一变量名与模型1的唯一变量名匹配。在

您可以找到为什么CudnnGRU在Layer中使用唯一的变量名。\u set_scope（）（tensorflow\python\layers\底座py#L150). Layer类使用默认的\u name参数为其变量创建一个新的变量范围（在本例中scope为None），因此它的名称变得唯一。在

相关问题更多 >

编程相关推荐

热门问题

热门文章