我想预测一个值。当我使用我的实际目标值时,我能够预测,它是一个天数,但是我尝试使用值的日志来预测,它给了我一个错误。我正在使用sklearn
和随机林。你知道吗
代码:
X = final_pressure_df.drop(['y', 'log_y', 'patient_id', 'wound_id'], axis=1)
Y = final_pressure_df['log_y']
X_train, X_test, Y_train, Y_test = sklearn.cross_validation.train_test_split(X, Y, test_size=0.4, random_state=5)
forest = RandomForestClassifier(criterion='entropy', n_estimators=200, max_depth=100, random_state=5)
forest.fit(X_train, Y_train)
错误:ValueError: Unknown label type: array([[ 3.91202301]
有人能帮我吗?你知道吗
你需要回归,而不是分类,所以使用
RandomForestRegressor
。 当被预测的变量是实值(float)时,分类将不起作用。即使在第一种情况下,当您预测天数时,使用回归仍然更有意义,因为您预测的是某个值,而不是类/类别中的天数。你知道吗相关问题 更多 >
编程相关推荐