计算均方误差返回y_true和y_pred的输出数不同(1!=10)

2024-06-16 10:48:08 发布

您现在位置:Python中文网/ 问答频道 /正文

我真的是个新手,学习很深。我想做一项任务,要求:根据测试数据评估模型,并计算预测混凝土强度和实际混凝土强度之间的均方误差。您可以使用Scikit学习中的均方误差函数

这是我的密码:

import pandas as pd
from tensorflow.python.keras import Sequential
from tensorflow.python.keras.layers import Dense
from sklearn.model_selection import train_test_split

concrete_data = pd.read_csv('https://cocl.us/concrete_data')

n_cols = concrete_data.shape[1]
model = Sequential()
model.add(Dense(units=10, activation='relu', input_shape=(n_cols-1,)))

model.compile(loss='mean_squared_error',
          optimizer='adam')


y = concrete_data.Cement
x = concrete_data.drop('Cement', axis=1)
xTrain, xTest, yTrain, yTest = train_test_split(x, y, test_size = 0.3)

model.fit(xTrain, yTrain, epochs=50)

现在,为了评估均方误差,我写了以下内容:

from sklearn.metrics import mean_squared_error
predicted_y = model.predict(xTest)
mean_squared_error(yTest, predicted_y)

我得到了这个错误:

y_true and y_pred have different number of output (1!=10)

我预测的y形是:(309,10)

我在谷歌上搜索了一下,真的找不到解决这个问题的答案。我不知道我的代码出了什么问题


Tags: fromtestimportdatamodeltensorflowerrormean
3条回答

实际上,您要检查的是mean_squared_errory_testpredicted_y

您必须检查您的模型对x_test的预测,即预测:

predicted_y = model.predict(x_test)

然后可以计算误差:

mean_squared_error(y_test, predicted_y)

你的y_test数据形状是(N,1),但是因为你在输出层放置了10个神经元,你的模型会做出10个不同的预测,这就是错误

您需要将输出层中的神经元数量更改为1,或者添加一个只有1个神经元的新输出层

下面的代码可能适合您

import pandas as pd
from tensorflow.python.keras import Sequential
from tensorflow.python.keras.layers import Dense
from sklearn.model_selection import train_test_split

concrete_data = pd.read_csv('https://cocl.us/concrete_data')

n_cols = concrete_data.shape[1]
model = Sequential()
model.add(Dense(units=10, activation='relu', input_shape=(n_cols-1,)))           
model.add(Dense(units=1))
model.compile(loss='mean_squared_error',
          optimizer='adam')


y = concrete_data.Cement
x = concrete_data.drop('Cement', axis=1)
xTrain, xTest, yTrain, yTest = train_test_split(x, y, test_size = 0.3)

model.fit(xTrain, yTrain, epochs=50)
y_pred = model.predict(x_test).sum(axis=1)

试试这个,它对我有用

相关问题 更多 >