分类库
我需要在一个大型数据集上测试一些著名的分类方法,比如kNN、ID3等等,然后选择一个适合未来使用的。
我对编程语言没有限制,但在学习和分类的过程中,代码的性能和可读性都非常重要。
因此,我在寻找一个好的库,要求有以下特点:
- 包含多种分类方法
- 性能高
- 易于使用
有什么建议吗?
3 个回答
1
试试 scikit learn 吧——它是用Python写的,里面有很多分类器和测试这些分类器的方法。
1
你可以看看 PyBrain,这是一个很棒的Python机器学习模块。我对它了解不多,因为我自己没用过,只是读过一些资料和看过几个用它解决的问题的项目,但听说它挺不错的。
你也可以看看这个Python机器学习模块的列表: http://web.media.mit.edu/~stefie10/technical/pythonml.html
或者看看这个StackOverflow上的问题: 有没有推荐的Python机器学习包?
0
看看这个叫 RapidMiner 的工具,它提供了一个Java接口和一些图形化的工具,专门用来挖掘数据。社区版是免费的,我记得是这样。
我在学生时代用过这个工具的前身,但并没有专业使用的经验。