线性回归的Python、GD和SGD实现

import pandas as pd from math import sqrt df = pd.read_csv("data.csv") df = df.sample(frac=1) X = df['X'].values y = df['y'].values m_current=0 b_current=0 epochs=100000 learning_rate=0.0001 N = float(len(y)) for i in range(epochs): y_current = (m_current * X) + b_current cost = sum([data**2 for data in (y-y_current)]) / N rmse = sqrt(cost) m_gradient = -(2/N) * sum(X * (y - y_current)) b_gradient = -(2/N) * sum(y - y_current) m_current = m_current - (learning_rate * m_gradient) b_current = b_current - (learning_rate * b_gradient) print("RMSE: ", rmse)

import pandas as pd from sklearn import linear_model from sklearn.metrics import mean_squared_error from math import sqrt data= pd.read_csv('data.csv') x = data.X.values.reshape(-1,1) y = data.y.values.reshape(-1,1).ravel() Model = linear_model.SGDRegressor(alpha = 0.0001, shuffle=True, max_iter = 100000) Model.fit(x,y) y_predicted = Model.predict(x) mse = mean_squared_error(y, y_predicted) print("RMSE: ", sqrt(mse))

1条回答

网友

1楼 · 发布于 2024-05-13 12:30:38

似乎您将alpha中的alpha设置为学习速率。alpha不是学习率。在

要设置恒定学习率，请将SGDClassifier'slearing_rate设置为constant，并将eta0设置为学习速率。在

您还需要将alpha设置为0，因为这是正则化项，而您的实现没有使用它。在

还要注意，由于这些算法本质上是随机的，所以将random_state设置为某个固定值可能是个好主意。在

相关问题更多 >

编程相关推荐

热门问题

热门文章