使用scikitlearn,如何在小数据集上学习支持向量机?

2024-04-24 03:42:54 发布

您现在位置:Python中文网/ 问答频道 /正文

利用scikit学习,我构建了一个支持向量机,用于基本的手写数字检测问题。在

我的全部数据集由235个观测值组成。我的观察结果由1025个特征组成。我知道使用支持向量机的一个优点是在这样的情况下,在这种情况下,只有少量的观测值具有大量的特征。在

在我的支持向量机被创建后,我看看我的混淆矩阵(如下)。。。在

Confusion Matrix:
[[ 6  0]
 [ 0 30]]

…并意识到,仅保留15%的数据进行测试(即36次观察)是不够的。在

我的问题是:如何使用交叉验证解决这个小数据问题?在


Tags: 数据利用情况矩阵数字特征scikit向量
1条回答
网友
1楼 · 发布于 2024-04-24 03:42:54

这正是交叉验证(及其推广,如Err^0.632)的目的。只有在数据量大的情况下,保留集才是合理的。在

相关问题 更多 >