文件上分离的数据集的交叉验证

1条回答

网友

1楼 · 发布于 2024-06-16 09:47:54

看看this answer，我意识到pandas可以连接数据帧。我检查了这个过程比cat命令行慢了15-20%，但是可以像我预期的那样进行折叠。在

不管怎样，我很确定应该有比这更好的方法：

import glob
import numpy as np
import pandas as pd
from sklearn.cross_validation import KFold

allFiles = glob.glob("./dataset/*.txt")
kf = KFold(len(allFiles), n_folds=3, shuffle=True)

for train_files, cv_files in kf:
    dataTrain = pd.concat((pd.read_csv(allFiles[idTrain], header=None) for idTrain in train_files))
    dataTest = pd.concat((pd.read_csv(allFiles[idTest], header=None) for idTest in cv_files))

编程相关推荐

java使用McClickListener单击了什么元素
Java时间戳在Oracle时间戳中不同情况下存储12 PM的奇怪行为
java无法使用事件总线对运行在不同机器上的垂直体进行通信
java Mockserver：收到请求后进行回调
java无法将Json字符串转换为Map<string，Object>
java如何按升序排列输出？
java视图行，带有oracle键。jbo。在SrCategoryParentIterator中找不到键[300100120394155]
javafxmysql连接示例
java正在等待加载完成
java是否可以将同一个有状态会话bean实例注入多个其他会话bean？

相关问题更多 >

编程相关推荐

热门问题

热门文章

文件上分离的数据集的交叉验证

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >