我试图用我从csv读取的数据建立一个test_train_split
数据框。我正在读的那本书说我应该把x_train
分为作为数据的y_train
和作为目标的y_train
,但是我如何定义哪个列是目标,哪个列是数据呢?到目前为止,我有以下几点
import pandas as pd
from sklearn.model_selection import train_test_split
Data = pd.read_csv("Data.csv")
我已经读过以下面的方式进行拆分的文章,但是下面使用的是一个已经定义了data
和target
的簇:
X_train, X_test, y_train, y_test = train_test_split(businessleisure_data['data'],
iris_dataset['target'], random_state=0)
你可以这样做:
在大多数情况下,目标变量是数据集的最后一列,因此您也可以尝试以下操作:
相关问题 更多 >
编程相关推荐