java使用Mahout 0.10将CSV文件转换为序列,以便使用随机林进行分类
我有一个CSV文件,我想将其转换为SequenceFile,用于使用随机森林算法的分类任务。我如何使用 mahout 0.10和netbeans
我的数据包含数值和标称值: http://archive.ics.uci.edu/ml/machine-learning-databases/00296/
你可以在下面搜索框中键入要查询的问题!
我有一个CSV文件,我想将其转换为SequenceFile,用于使用随机森林算法的分类任务。我如何使用 mahout 0.10和netbeans
我的数据包含数值和标称值: http://archive.ics.uci.edu/ml/machine-learning-databases/00296/
# 1 楼答案
使用uniVocity-parsers中的CSV解析器读取文件
我快速查看了您的文件,您可以非常轻松地将这些“否”、“是”和“无”值转换为布尔值/空值:
如果您更喜欢带有注释的对象,可以使用
BeanListProcessor
作为详细说明here。也许这对你来说是最好的方法披露:我是这个图书馆的作者。它是开源和免费的(Apache V2.0许可证)