Gensim 获取文档的主题(已知文档)

8 投票
1 回答
1833 浏览
提问于 2025-04-18 02:30

我知道在用gensim训练lda模型之后,我们可以通过以下方式获取一个新文档的主题:

lda = LdaModel(corpus, num_topics=10)
doc_lda = lda[doc_bow]

但是,对于那些已经用来训练的文档呢?我的意思是,有没有办法获取那些在训练中使用的文档的主题,而不把它们当成新文档来处理?

1 个回答

8

不。

每个文档中的信息会被提炼到模型里,然后就被遗忘了。也就是说,模型不会保存每个文档的具体信息(更一般来说:不会保存需要占用O(#docs)内存的信息)。

撰写回答