有两个输入的Tensorflow op，返回其中一个并覆盖gradien

@ops.RegisterGradient("SynthGrad") def _SynthGrad(op, grad): dim1 = tf.shape(op.inputs[1])[1] dim2 = tf.shape(op.inputs[0])[1] B = tf.random_normal([dim1, dim2]) synth_grad = tf.matmul(op.inputs[1], B) return synth_grad

2条回答

网友

1楼 · 编辑于 2024-04-25 22:47:28

我不知道你是如何解决你的问题的，但上面的解决方案中的“op_name”和“some_name”的名称不会显示在图表上。因此，您将无法使用gradient_override_map（{“op_name”：“SynthGrad”}）。在

一种可能的解决方案：如果在forwardpass中有一个自定义的tensorflow op x=f（a，b），但希望它在backwardpass中表现为g（a，b），可以执行以下操作：

t=g（a，b）输出=t+tf.stop_梯度（f（a，b）-t

但是，您需要在C++中定义g（a，b）作为具有名称的哑/身份操作符。稍后，您可以使用渐变覆盖图。在

网友

2楼 · 编辑于 2024-04-25 22:47:28

可以在模型定义期间添加以下代码来覆盖渐变。 tf.Graph有{a1}构造来实现相同的目的

g = tf.get_default_graph()
...model, definiton, input other op etc

# gradient overrring map construct with the function `f` in your case
with g.gradient_override_map({"op_name": "SynthGrad"}):
    f_out = f(op_in_1, op_in_2, name="op_name")

...
# code related to custom function and custom gradient from your question
def f(a, b, name='some_name'):
    ... some stuffs
    return a    

@tf.RegisterGradient("SynthGrad")
def _SynthGrad(op, grad):
    dim1 = tf.shape(op.inputs[1])[1]
    dim2 = tf.shape(op.inputs[0])[1]
    B = tf.random_normal([dim1, dim2])
    synth_grad = tf.matmul(op.inputs[1], B)
    return synth_grad

相关问题更多 >

编程相关推荐

热门问题

热门文章