Gensim 获取文档的主题(已知文档)
我知道在用gensim训练lda模型之后,我们可以通过以下方式获取一个新文档的主题:
lda = LdaModel(corpus, num_topics=10)
doc_lda = lda[doc_bow]
但是,对于那些已经用来训练的文档呢?我的意思是,有没有办法获取那些在训练中使用的文档的主题,而不把它们当成新文档来处理?
1 个回答
8
不。
每个文档中的信息会被提炼到模型里,然后就被遗忘了。也就是说,模型不会保存每个文档的具体信息(更一般来说:不会保存需要占用O(#docs)
内存的信息)。