稀疏特征矩阵上的分层KFold(csr)

2024-04-27 00:54:03 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个大的稀疏矩阵(9500012000)包含我的模型的特性。我想用Sklearn.cross_验证python中的模块。但是,我还没有找到一种在python中索引稀疏矩阵的方法。在

有什么我可以在我的稀疏特征矩阵上执行分层折叠吗?在


Tags: 模块方法模型分层矩阵特征特性sklearn
1条回答
网友
1楼 · 发布于 2024-04-27 00:54:03

试试这个:

# First make sure sparse matrix is to_csr
X_sparse = x.tocsr()
y= output
X_train = {}
Y_train = {}

skf = StratifiedKFold(5, shuffle=True, random_state=12345)
i=0
for train_index, test_index in skf.split(X,y):
    print("TRAIN:", train_index, "TEST:", test_index)
    X_train[i], X_test[i] = X[train_index], X[test_index]
    y_train[i], y_test[i] = y[train_index], y[test_index]
    i +=1

相关问题 更多 >