2024-04-24 06:29:31 发布
网友
我对scikit的学习还比较陌生,我正在学习和预测iris数据集中的样本的一些例子。但是,如何为此加载外部数据集?你知道吗
我下载了一个数据集,其数据格式如下:
id attr1 attr2 .... label 123 0 0 ..... abc 234 0 0 ..... dsf .... ....
那么我应该如何加载这个数据集来学习和绘制预测呢?谢谢。你知道吗
一种选择是使用^{}。假设数据是空间分隔的:
import pandas as pd X = pd.read_csv('data.txt', sep=' ').values
其中^{}返回DataFrame,values属性返回包含数据的numpy数组。您可能希望将上述X的最后一列分离出来作为标签,比如说,放入一维数组y:
DataFrame
values
X
y
X, y = X[:, :-1], X[:, -1]
一种选择是使用^{} 。假设数据是空间分隔的:
其中^{} 返回
DataFrame
,values
属性返回包含数据的numpy数组。您可能希望将上述X
的最后一列分离出来作为标签,比如说,放入一维数组y
:相关问题 更多 >
编程相关推荐