sklearn SVC + 稀疏数据加速
大家好!
我遇到了一个大麻烦,因为支持向量机(SVC)运行得太慢了。而且我无法对数据进行标准化,因为数据很稀疏,矩阵的大小对于密集表示来说太大了。我通过以下方式对数据进行了缩放:
sklearn.preprocessing.scale
但这还不够。有什么办法可以加快SVC的计算速度吗?
1 个回答
2
1) 买一台内存超大的电脑,这样你就可以把整个矩阵都放在内存里。内存的大小对LibSVM的性能影响最大,而LibSVM正是scikit-learn使用的算法。
2) 换一个算法。scikit-learn已经在使用LibSVM,这可能是目前最快的基于SMO的支持向量机实现。