在PCA之后解释OLS权重（在Python中）

import numpy as np import sklearn.datasets, sklearn.decomposition from sklearn.linear_model import LinearRegression # load data X = sklearn.datasets.load_iris().data w = np.array([0.3, 10, -0.1, -0.01]) Y = np.dot(X, w) # set number of components to keep from PCA n_components = 4 # reconstruct w reg = LinearRegression().fit(X, Y) w_hat = reg.coef_ print(w_hat) # apply PCA pca = sklearn.decomposition.PCA(n_components=n_components) pca.fit(X) X_trans = pca.transform(X) # reconstruct w reg_trans = LinearRegression().fit(X_trans, Y) w_trans_hat = np.dot(reg_trans.coef_, pca.components_) print(w_trans_hat)

1条回答

网友

1楼 · 发布于 2024-05-01 21:56:02

我认为这很好，只是我看到的是w_trans_hat，而不是重建的Y：

import numpy as np
import sklearn.datasets, sklearn.decomposition
from sklearn.linear_model import LinearRegression

# load data
X = sklearn.datasets.load_iris().data
# create fake loadings
w = np.array([0.3, 10, -0.1, -0.01])
# centre X
X = np.subtract(X, np.mean(X, 0))
# calculate Y
Y = np.dot(X, w)

# set number of components to keep from PCA
n_components = 3

# reconstruct w using linear regression
reg = LinearRegression().fit(X, Y)
w_hat = reg.coef_
print(w_hat)

# apply PCA
pca = sklearn.decomposition.PCA(n_components=n_components)
pca.fit(X)
X_trans = pca.transform(X)

# regress Y on principal components
reg_trans = LinearRegression().fit(X_trans, Y)
# reconstruct Y using regressed weights and transformed X
Y_trans = np.dot(X_trans, reg_trans.coef_)
# show MSE to original Y
print(np.mean((Y - Y_trans) ** 2))

# show w implied by reduced model in original space
w_trans_hat = np.dot(reg_trans.coef_, pca.components_)
print(w_trans_hat)

相关问题更多 >

编程相关推荐

热门问题

热门文章