如何将多个渐变与TensorFlow渐变带一起使用？

with tf.GradientTape() as tape1: with tf.GradientTape() as tape2: output1 = NN_model1(input1, training=True) output2 = NN_model2(output1, training=True) output3 = NN_model3([input1, output1, output2], training=True) loss1 = -tf.math.reduce_mean(output3) loss2 = -tf.math.reduce_mean(output2) grad1 = tape2.gradient(loss1, NN_model1.trainable_variables) grad2 = tape1.gradient(loss2, grad1) optimizer.apply_gradients(zip(grad2, NN_model1.trainable_variables))

1条回答

网友

1楼 · 发布于 2024-04-20 13:53:26

我认为正确的方法应该是：

with tf.GradientTape() as tape:
    output1 = NN_model1(input1, training=True)
    output2 = NN_model2(output1, training=True)
    output3 = NN_model3([input1, output1, output2], training=True)
    loss1 = -tf.math.reduce_mean(output3)
    loss2 = -tf.math.reduce_mean(output2)
grad = tape.gradient([loss1, loss2], NN_model1.trainable_variables)
optimizer.apply_gradients(zip(grad, NN_model1.trainable_variables))

相关问题更多 >

编程相关推荐

热门问题

热门文章