用幕府将军工具箱加载数据

2024-06-16 09:28:12 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在尝试使用幕府幕府工具箱,以便将this dataset中的人归类为溺水者还是非溺水者。你知道吗

我想使用幕府发动机像CFIle,LibSVMFile,sparsereallfeatures等。。。正如在shogun introduction中提到的,但我有点结巴了。你知道吗

首先,在本简介中,您直接加载该格式的LibSVMFile,但是,autor没有提到如何从CSV格式(这是他使用的数据集的原始格式)生成数据文件。。。你知道吗

由于没有所需格式的数据集,我尝试用CFile类加载数据集,或者更好地用CCSVFile类加载数据集,但是

NameError: name 'CFile' is not defined

以及

NameError: name 'CCSVFile' is not defined

(我使用的是从ubuntu17.10的源代码编译而来的shogun throught Python3,我用“from shogun import*”导入所有的shogun)

然而,当我使用

data_file=LibSVMFile(os.path.join(SHOGUN_DATA_DIR, 'train.csv'))

如示例中所示,关于未定义的类没有错误,但是 正如预期的那样,它退化为:

[1]    8870 segmentation fault (core dumped)  python3 titanic.py

我想知道什么是正确的方式来使用这个幕府将军引擎,以便加载数据集。。。你知道吗

在其他幕府笔记本中,他们没有使用它们,只是使用其他库加载数据集,我开始认为这是最好的方法。你知道吗


Tags: 数据nameis格式not工具箱thisdefined
1条回答
网友
1楼 · 发布于 2024-06-16 09:28:12

要读取CSV文件,应运行以下命令(在python中):

import shogun as sg
train_csv = sg.CSV("train.csv")

但是请注意,该文件包含许多需要编码的分类,因此在实际尝试在幕府将军模型中使用它之前,首先应该进行一些数据挖掘。你知道吗

相关问题 更多 >