Tensorflow自定义层权重不是训练，而是偏差

class myWeights(Layer): def __init__(self, units, **kwargs): self.units = units super(myWeights, self).__init__(**kwargs) def build(self, input_shape): self.w = self.add_weight(shape=(input_shape[-1], self.units), initializer='GlorotUniform', trainable=True) self.b = self.add_weight(shape=(self.units,), initializer='random_normal', trainable=True) super(myWeights, self).build(input_shape) def call(self, inputs): return tf.matmul(inputs, self.w) + self.b def compute_output_shape(self, input_shape): return(input_shape[0],self.units)

tf.random.set_seed(1234) mnist = tf.keras.datasets.mnist (x_train, y_train), (x_test, y_test) = mnist.load_data() x_train=tf.keras.utils.normalize(x_train, axis=1) x_test=tf.keras.utils.normalize(x_test, axis=1)

inp=Input(shape=(x_train.shape[1:])) flat=Flatten()(inp) hid=myWeights(32)(flat) out=Dense(10, 'softmax')(hid) model=Model(inp,out) model.compile(optimizer='adam', loss='sparse_categorical_crossentropy', metrics=['accuracy'])

1条回答

网友

1楼 · 发布于 2024-04-25 14:52:40

您尝试的是多层感知器（MLP），MLP通常由一个（直通）输入层、一个或多个层组成 TLU的一层称为隐藏层，TLU的最后一层称为输出层

在这里，信号只在一个方向上流动（从输入到输出），因此体系结构是前向神经网络（FNN）的一个例子。

请看这个link，它将解释前馈神经网络

关于代码的解释，您正在使用一些初始值设定项初始化权重。因此，权重的第一次初始化发生在隐藏层，然后在下一个密集层中更新。
因此，无论初始化的权重是什么，即使在隐层中进行训练后也将保持不变，因为它是一个前馈神经网络，这意味着它不依赖于当前层的输出

但是如果你想检查你的代码，那么你可以再包含一个隐藏层，就像现在的一样，并查看第3层（隐藏层2）的权重，看起来像这样

inp=Input(shape=(x_train.shape[1:]))
flat=Flatten()(inp)
hid=myWeights(32)(flat)
hid2=myWeights(32)(hid)
out=Dense(10, 'softmax')(hid2)
model=Model(inp,out)
model.compile(optimizer='adam',
         loss='sparse_categorical_crossentropy',
         metrics=['accuracy'])

然后，通过打印hidden2层的“拟合前”和“拟合后”权重，将为您提供不同的权重，因为“隐藏2”层的权重取决于“隐藏1”层的输出

print(model.layers[3].get_weights())

相关问题更多 >

编程相关推荐

热门问题

热门文章