如何使用gensim包以一组种子词初始化LDA

0 投票
1 回答
1322 浏览
提问于 2025-04-16 14:47

我看过几篇论文,里面提到他们用一组特定的词来初始化LDA的参数。有没有人知道在gensim这个工具包里怎么做到这一点?

1 个回答

3

为了让内容更完整,这里引用一下来自 gensim 邮件列表的回复:

在之前的某些版本中,gensim 允许使用已有的文档来进行初始化,这段代码是直接从 LDA-C 移植过来的。这样做的目的是为了提高收敛速度(虽然最终的结果是一样的)。

但在最近的版本中,这段代码被一种更高效的算法替代了,这种新算法不再使用初始化。它是一种在线(小批量)算法,可以说它以一种更合理的方式自动进行“初始化”。

撰写回答