Python Theano scan（）函数

import numpy as np import theano import theano.tensor as T def addf(a1,a2): return a1+a2 i = T.iscalar('i') x0 = T.ivector('x0') step= T.iscalar('step') results, updates = theano.scan(fn=addf, outputs_info=[{'initial':x0, 'taps':[-2]}], non_sequences=step, n_steps=i) f=theano.function([x0,i,step],results) print f([1,1],10,2)

1条回答

网友

1楼 · 发布于 2024-06-11 21:45:08

当使用taps=[-1]时，scan假设输出信息中的信息按原样使用。这意味着addf函数将以向量和非u序列作为输入来调用。如果将x0转换为标量，它将按预期工作：

import numpy as np
import theano
import theano.tensor as T


def addf(a1,a2):
        print a1.type
        print a2.type
        return a1+a2

i = T.iscalar('i')
x0 = T.iscalar('x0') 
step= T.iscalar('step')

results, updates = theano.scan(fn=addf,
                   outputs_info=[{'initial':x0, 'taps':[-1]}],
                   non_sequences=step,
                   n_steps=i)

f=theano.function([x0,i,step],results)

print f(1,10,2)

这将产生以下输出：

TensorType(int32, scalar)
TensorType(int32, scalar)
[ 3  5  7  9 11 13 15 17 19 21]

在您的例子中，就像它做addf（vector，scalar）一样，它广播elemwise值。

另一种解释是，如果taps是[-1]，x0将按原样传递给内部函数。如果taps包含任何其他内容，传递给内部函数的内容将比x0小1维，因为x0必须提供许多初始步骤值（-2和-1）。

相关问题更多 >

编程相关推荐

热门问题

热门文章