我是Python新手,我读到的相关问题对我来说没有多大意义。我有以下问题。我想使用Python进行多元回归,我正在尝试statsmodels。在这种情况下,我想做一个散点图。
我的数据示例:
ID order V1 V2 E1 E2 E3 M
103 1 ECA TEXT 7 3 5 7
105 1 ECA TEXT 3 7 4 5
107 1 ECA TEXT 7 7 7 4
109 1 ECA TEXT 6 6 6 3
我想做一个多元回归,E1-E3作为我的IVs,M的平均分作为我的DV。
这就是我加载数据的方式。
myRegressionData = pd.read_csv('C:/Users/user/Desktop/Folder 1/Python/Regression data file.csv')
这是我的x和y:
X_sk = myRegressionData[[col for col in myRegressionData.columns if col[:8] == 'E']]
Y = myRegressionData[['M{}'.format(ii) for ii in range(1, 19)]]
y = np.mean(Y, axis=1)
这是我得到错误的代码:
myRegressionData.plot(kind='scatter',x = X_sk, y=np.mean(Y, axis=1))
回报
ValueError:只能传递带有布尔值的DataFrame
myRegressionData.info()
回报
范围索引:90个条目,0到89列:146个条目,IDOpenEndedResponse to EngagingAA数据类型:float64(10),int64(134),对象(2)内存使用:102.7+KB
目前没有回答
相关问题 更多 >
编程相关推荐