我如何用数字表示单词,使相似的单词彼此之间有相近的数字

2024-06-16 11:53:20 发布

您现在位置:Python中文网/ 问答频道 /正文

我必须实现一个机器学习算法,特别是线性回归,使用包括文本(通常是一个单词)和数字的功能。你知道吗

我如何用数字来表示单词,使得相似的单词用更接近的数字来表示,而不是用不同单词的数字来表示。你知道吗

你知道吗示例:-你知道吗

日志4J1.2rc1->;60

日志4J2.8->;61

支柱1.3.10->;90

我签出了Word2Vec,但是在使用它之前需要用大量的单词来训练模型。我的限制是,我不知道所有的话,我只会收到他们像一条小溪。你知道吗

更新:好的,我要说的是,“单词”是软件库的各种特性,如库名、文件名、路径等。给定一个文件,ML算法必须确定它属于哪个库。你知道吗


Tags: 模型文本gt功能算法机器示例软件