使用Gensim更新TFIDF

2024-03-29 11:07:12 发布

您现在位置:Python中文网/ 问答频道 /正文

嗨,我正在使用Gensim来查找文档之间的相似性,所以我对文档进行TF-IDF并计算余弦相似性。当我有新文档时,我可以使用索引[tfidf[vec]]计算此文档与以前文档的相似度,但这样TF-IDF不会更新,并且在相似度计算中不考虑新单词有没有解决方案可以快速更新TF-IDF而不重新计算整个矩阵,或者什么是解决我问题的最佳方案?你知道吗


Tags: 文档tf方案矩阵解决方案相似性单词tfidf