Sequence2层序模型中的层形误差与Keras注意

embedding_size=200 UNITS=128 encoder_inputs = Input(shape=(None,), name="encoder_inputs") encoder_embs=Embedding(num_encoder_tokens, embedding_size, name="encoder_embs")(encoder_inputs) #encoder lstm encoder = LSTM(UNITS, return_state=True, name="encoder_LSTM") #(encoder_embs) encoder_outputs, state_h, state_c = encoder(encoder_embs) encoder_states = [state_h, state_c] decoder_inputs = Input(shape=(None,), name="decoder_inputs") decoder_embs = Embedding(num_decoder_tokens, embedding_size, name="decoder_embs")(decoder_inputs) #decoder lstm decoder_lstm = LSTM(UNITS, return_sequences=True, return_state=True, name="decoder_LSTM") decoder_outputs, _, _ = decoder_lstm(decoder_embs, initial_state=encoder_states) attention=Attention(name="attention_layer") attention_out=attention([encoder_outputs, decoder_outputs]) decoder_concatenate=Concatenate(axis=-1, name="concat_layer")([decoder_outputs, attention_out]) decoder_outputs = TimeDistributed(Dense(units=num_decoder_tokens, activation='softmax', name="decoder_denseoutput"))(decoder_concatenate) model=Model([encoder_inputs, decoder_inputs], decoder_outputs, name="s2s_model") model.compile(optimizer='RMSprop', loss='categorical_crossentropy', metrics=['accuracy']) model.summary()

ValueError: Dimension 1 in both shapes must be equal, but are 12 and 32. Shapes are [32,12] and [32,32]. for '{{node s2s_model/concat_layer/concat}} = ConcatV2[N=2, T=DT_FLOAT, Tidx=DT_INT32](s2s_model/decoder_LSTM/PartitionedCall:1, s2s_model/attention_layer/MatMul_1, s2s_model/concat_layer/concat/axis)' with input shapes: [32,12,128], [32,32,128], [] and with computed input tensors: input[2] = <2>.

2条回答

网友

1楼 · 编辑于 2024-05-23 13:46:53

多亏了@majitima解决了这个问题。我将输入交换到注意层，因此

attention=Attention(name="attention_layer")
attention_out=attention([encoder_outputs, decoder_outputs])

输入是

attention=Attention(name="attention_layer")
attention_out=attention([decoder_outputs, encoder_outputs])

与

decoder_concatenate=Concatenate(axis=-1, name="concat_layer")([decoder_outputs, attention_out])

现在一切似乎都正常了，再次感谢@Majitima，希望这能有所帮助

网友

2楼 · 编辑于 2024-05-23 13:46:53

将连接层中的轴=-1替换为轴=1。{a1}中的例子应该说明原因

问题在于传递给串联的输入。您需要指定右轴来连接两个不同形状的矩阵或张量，因为它们在Tensorflow中被称为。形状[32,12,128]和[32,32,128]在传递1引用的第二个维度中有所不同（因为维度从0开始向上）。这将导致形状[32，（12+32），128]，增加第二维度中的元素

当您将axis指定为-1（默认值）时，连接层基本上会在使用前将输入展平，在您的情况下，由于尺寸不同，这不起作用

相关问题更多 >

编程相关推荐

热门问题

热门文章