TensorFlow/Keras: 输出层形状错误

2024-04-25 00:59:53 发布

您现在位置:Python中文网/ 问答频道 /正文

我已经在互联网上搜索了几天,试图找到解决这个错误的方法,但是我找不到任何特别适用的东西:

ValueError: Error when checking target: expected dense_2 to have shape (300,) but got array with shape (60,)

以下是生成错误的代码(数据预处理除外):

^{pr2}$

我不确定是什么导致了这个错误,但我做了一些故障排除,试图缩小可能性。在

我尝试的第一件事是尝试运行TensorFlow网站上的一个示例,我选择了位于here的MNIST时尚示例。在

这段代码运行时没有出错,而且经过良好的训练,所以我不认为这是在我的TensorFlow或Python下载中的错误。在

然后我尝试复制MNIST时尚示例中使用的模型来测试它是否是我的模型中的错误。代码如下:

model = keras.Sequential([
    keras.layers.Flatten(input_shape=(60,)),
    keras.layers.Dense(128, activation=tf.nn.relu),
    keras.layers.Dense(10, activation=tf.nn.softmax)
])
model.compile(optimizer=tf.train.AdamOptimizer(),
loss = 'sparse_categorical_cross_entropy',
metrics = ['accuracy']
)

我对模型所做的唯一更改是第一层的输入形状,这样它就可以接收我的数据了。但错误仍然存在:

ValueError: Error when checking target: expected dense_1 to have shape (10,) but got array with shape (60,)

我做的最后一件事是创建自己的密集模型,它将接受通过np.random.random创建的虚拟数据。在

这是整个文件:

import tensorflow as tf
from tensorflow import keras
import numpy as np
import matplotlib.pyplot as plt

data = np.random.random((50,60))
datalabels = np.random.random((50,60))
model = keras.Sequential([
keras.layers.Dense(128,input_shape=(60,), activation="relu"),
keras.layers.Dense(50, activation="relu"),
keras.layers.Dense(10, activation="tanh")

])
model.compile(optimizer=tf.train.AdamOptimizer(),
loss="mae",
metrics=['mse'])

model.fit(data, datalabels, epochs=5, batch_size=10)

这也收到了错误,我很困惑为什么,但我认为这可能与生成我的虚拟数据有关

ValueError: Error when checking target: expected dense_2 to have shape (10,) but got array with shape (60,)

如果有帮助,我打印了最后一个模型的所有层及其输入和输出形状:

Layer: dense
    input_shape: (None, 60)
    output_shape: (None, 128)
Layer: dense_1
    input_shape: (None, 128)
    output_shape: (None, 50)
Layer: dense_2
    input_shape: (None, 50)
    output_shape: (None, 10)

这个错误最让我困惑的是它只在输出层出错。如果我在模型的末尾添加另一层,则该层将出错,除非输出层中的单元数等于模型输入的形状(例如:对于input_shape=(60,),最后一层单元的数量等于60)。有人知道为什么会这样吗?在


Tags: 数据模型noneinputmodellayerstf错误
1条回答
网友
1楼 · 发布于 2024-04-25 00:59:53

使用model.summary()可以看到每个层的输出形状。在您提供的第一个示例中,最后一层的输出形状(也是模型的输出形状)是(None, 300)。这意味着它需要形状(300,)(即每个标签的形状)。但是,在调用fit,即trainlabels时提供给模型的labels数组的形状似乎是(num_samples, 60)。然而,它必须与模型的输出形状一致,因此具有(num_samples, 300)的形状。同样的事情也适用于你提到的所有其他失败的例子。在

相关问题 更多 >