处理外部数据

2024-04-24 06:29:31 发布

您现在位置:Python中文网/ 问答频道 /正文

我对scikit的学习还比较陌生,我正在学习和预测iris数据集中的样本的一些例子。但是,如何为此加载外部数据集?你知道吗

我下载了一个数据集,其数据格式如下:

id attr1 attr2 .... label
123 0 0 ..... abc
234 0 0 ..... dsf
....
....

那么我应该如何加载这个数据集来学习和绘制预测呢?谢谢。你知道吗


Tags: 数据idiris绘制scikitlabel例子样本
1条回答
网友
1楼 · 发布于 2024-04-24 06:29:31

一种选择是使用^{}。假设数据是空间分隔的:

import pandas as pd
X = pd.read_csv('data.txt', sep=' ').values

其中^{}返回DataFramevalues属性返回包含数据的numpy数组。您可能希望将上述X的最后一列分离出来作为标签,比如说,放入一维数组y

X, y = X[:, :-1], X[:, -1]

相关问题 更多 >