准备训练数据集

2024-04-24 04:36:27 发布

您现在位置:Python中文网/ 问答频道 /正文

准备训练数据集时,是否需要从训练数据集中删除目标变量数据,或者可以将其保留在中?那么,下面代码中的X = df[:,:]是否应该排除目标变量,或者它是否重要?你知道吗

# Feature to be predicted (y)
y = df['predicted'] #target variable

#Training data
X = df[:,:]

# Perform a 70% train and 30% test data split
X_train, X_test, y_train, y_test = ____(X, y, ____=____)

Tags: to数据代码testtarget目标dfdata
2条回答

离开或不离开目标取决于您使用的机器学习库。创建训练数据集时,某些库提供了一个选项,可以指定要用于训练的列。对于这些库,您不必从训练数据中删除任何内容。你知道吗

Sklearn没有这个选项,所以您必须删除目标特性。你知道吗

# Feature to be predicted (y)
y = df['predicted'] #target variable

#Training data
X = df.drop("predicted",1)
# here 1 is the axis which means drop a column

# Perform a 70% train and 30% test data split
X_train, X_test, y_train, y_test = ____(X, y, ____=____)

你不能把标签留在特性集中,你会泄露现成的答案。你知道吗

X = df.drop(columns = 'predicted')

相关问题 更多 >