使用scikitlearn，如何在小数据集上学习支持向量机？

2024-04-24 03:42:54 发布

男 | 程序猿一只，喜欢编程写python代码。

利用scikit学习，我构建了一个支持向量机，用于基本的手写数字检测问题。在

我的全部数据集由235个观测值组成。我的观察结果由1025个特征组成。我知道使用支持向量机的一个优点是在这样的情况下，在这种情况下，只有少量的观测值具有大量的特征。在

在我的支持向量机被创建后，我看看我的混淆矩阵（如下）。。。在

Confusion Matrix:
[[ 6  0]
 [ 0 30]]

…并意识到，仅保留15%的数据进行测试（即36次观察）是不够的。在

我的问题是：如何使用交叉验证解决这个小数据问题？在

Tags：数据利用情况矩阵数字特征 scikit 向量

1条回答

网友

1楼 · 发布于 2024-04-24 03:42:54

这正是交叉验证（及其推广，如Err^0.632）的目的。只有在数据量大的情况下，保留集才是合理的。在