如何使用gensim包以一组种子词初始化LDA
我看过几篇论文,里面提到他们用一组特定的词来初始化LDA的参数。有没有人知道在gensim这个工具包里怎么做到这一点?
1 个回答
3
为了让内容更完整,这里引用一下来自 gensim 邮件列表的回复:
在之前的某些版本中,gensim 允许使用已有的文档来进行初始化,这段代码是直接从 LDA-C 移植过来的。这样做的目的是为了提高收敛速度(虽然最终的结果是一样的)。
但在最近的版本中,这段代码被一种更高效的算法替代了,这种新算法不再使用初始化。它是一种在线(小批量)算法,可以说它以一种更合理的方式自动进行“初始化”。