有没有一种方法可以对多个输出层应用渐变梯度胶带？

2024-05-14 14:00:41 发布

您现在位置：Python中文网/ 问答频道 /正文

1046

网友

男 | 程序猿一只，喜欢编程写python代码。

我试图将梯度应用于两个输出模型，但结果表明模型无法学习，损失也不会减少，我需要你的支持非常感谢。在

在@tf.功能 def列步骤（inp、targ、intent、enc U隐藏）：

loss = 0
intent_loss = 0

with tf.GradientTape(persistent= True) as tape:

    enc_output, enc_hidden = encoder(inp, enc_hidden)

    dec_hidden = enc_hidden




    dec_input = tf.expand_dims([targ_lang.word_index['<start>']] * BATCH_SIZE, 1)

    # Teacher forcing - feeding the target as the next input
    for t in range(1, targ.shape[1]):

        # passing enc_output to the decoder
        predictions, dec_hidden, _ =slot_decoder(dec_input, dec_hidden, enc_output)
        intent_pred, _ = intent_decoder(dec_hidden, enc_output)

        loss += loss_function(targ[:, t], predictions)
        intent_loss = loss_function(intent, intent_pred)

        # using teacher forcing
        dec_input = tf.expand_dims(targ[:, t], 1)

batch_loss = (loss / int(targ.shape[1])) + intent_loss

intent_variables = encoder.trainable_variables + intent_decoder.trainable_variables
slot_variables = encoder.trainable_variables + slot_decoder.trainable_variables

intent_gradients = tape.gradient(intent_loss, intent_variables)
slot_gradients = tape.gradient(loss, slot_variables)


optimizer.apply_gradients(zip(intent_gradients, intent_variables))
optimizer.apply_gradients(zip(slot_gradients, slot_variables))

del tape
return batch_loss + intent_loss

Tags： input output tf variables dec hidden slot enc

0条回答

目前没有回答

有没有一种方法可以对多个输出层应用渐变梯度胶带？

相关问题更多 >

编程相关推荐

热门问题

热门文章

有没有一种方法可以对多个输出层应用渐变梯度胶带？

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >