我必须实现一个机器学习算法,特别是线性回归,使用包括文本(通常是一个单词)和数字的功能。你知道吗
我如何用数字来表示单词,使得相似的单词用更接近的数字来表示,而不是用不同单词的数字来表示。你知道吗
你知道吗示例:-你知道吗
日志4J1.2rc1->;60
日志4J2.8->;61
支柱1.3.10->;90
我签出了Word2Vec,但是在使用它之前需要用大量的单词来训练模型。我的限制是,我不知道所有的话,我只会收到他们像一条小溪。你知道吗
更新:好的,我要说的是,“单词”是软件库的各种特性,如库名、文件名、路径等。给定一个文件,ML算法必须确定它属于哪个库。你知道吗
目前没有回答
相关问题 更多 >
编程相关推荐