如何找到与FastText相似的单词?

2024-05-14 10:41:55 发布

您现在位置:Python中文网/ 问答频道 /正文

我在玩FastTexthttps://pypi.python.org/pypi/fasttext,这与Word2Vec非常相似。因为它看起来是一个新的库,还没有很多内置功能,所以我想知道如何提取形态相似的词。

例如:狗。但是没有内置的功能。

如果我打字 model["dog"]

我只得到向量,可以用来比较余弦相似性。 model.cosine_similarity(model["dog"], model["dogs"]])

我需要在文本中对所有可能的对进行某种循环和cosine_similarity吗?那需要时间。。。!!!


Tags: httpsorg功能pypimodelword2vec相似性向量
3条回答

您可以安装并导入gensim库,然后使用gensim库从从FastText下载的模型中提取最相似的单词。

使用这个:

import gensim
model = gensim.models.KeyedVectors.load_word2vec_format('model.vec')
similar = model.most_similar(positive=['man'],topn=10)

通过topn参数,可以得到前10个最相似的单词。

使用Gensim,使用load.word2vec模型加载fastText trained.vec文件,并使用most_similiar()方法查找相似的单词!

您应该使用gensim加载model.vec,然后得到类似的单词:

m = gensim.models.Word2Vec.load_word2vec_format('model.vec')
m.most_similar(...)

相关问题 更多 >

    热门问题