将Pandas数据帧转换为数组并计算多元线性回归模型

from sklearn.linear_model import LinearRegression X = [[6, 2], [8, 1], [10, 0], [14, 2], [18, 0]] // need to modify for my problem y = [[7],[9],[13],[17.5], [18]] // need to modify model = LinearRegression() model.fit(X, y)

2条回答

网友

1楼 · 编辑于 2024-05-29 06:00:30

y = broken_df.ground_truth.values
X = broken_df.drop('ground_truth', axis=1).values
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)
linreg = LinearRegression()
linreg.fit(X_train, y_train)
y_pred = linreg.predict(X_test)
print(linreg.score(X_test, y_test)
print(classification_report(y_test, y_pred))

网友

2楼 · 编辑于 2024-05-29 06:00:30

可以直接在dataframe对象上使用方法as_matrix将dataframe转换为矩阵。您可能需要指定对X=df[['x1','x2','X3']].as_matrix()感兴趣的列，其中不同的x是列名。

对于y变量，可以使用y = df['ground_truth'].values获取数组。

下面是一些随机生成的数据的示例：

import numpy as np
#create a 5X5 dataframe
df = pd.DataFrame(np.random.random_integers(0, 100, (5, 5)), columns = ['X1','X2','X3','X4','y'])

在df上调用as_matrix()返回numpy.ndarray对象

X = df[['X1','X2','X3','X4']].as_matrix()

调用values返回熊猫的numpy.ndarray

y =df['y'].values

注意：您可能会收到一个警告，说：FutureWarning: Method .as_matrix will be removed in a future version. Use .values instead.

要修复它，请使用values，而不是as_matrix，如下所示

X = df[['X1','X2','X3','X4']].values

相关问题更多 >

编程相关推荐

热门问题

热门文章