我在玩FastText
,https://pypi.python.org/pypi/fasttext,这与Word2Vec
非常相似。因为它看起来是一个新的库,还没有很多内置功能,所以我想知道如何提取形态相似的词。
例如:狗。但是没有内置的功能。
如果我打字
model["dog"]
我只得到向量,可以用来比较余弦相似性。
model.cosine_similarity(model["dog"], model["dogs"]])
。
我需要在文本中对所有可能的对进行某种循环和cosine_similarity
吗?那需要时间。。。!!!
您可以安装并导入gensim库,然后使用gensim库从从FastText下载的模型中提取最相似的单词。
使用这个:
通过topn参数,可以得到前10个最相似的单词。
使用Gensim,使用load.word2vec模型加载fastText trained.vec文件,并使用most_similiar()方法查找相似的单词!
您应该使用gensim加载
model.vec
,然后得到类似的单词:相关问题 更多 >
编程相关推荐