使用潜在狄利克雷分配进行主题预测

2 投票
1 回答
3386 浏览
提问于 2025-04-16 15:17

我在一堆文档上使用了LDA(潜在狄利克雷分配)算法,找出了一些主题。我的代码输出了两个矩阵,分别包含概率信息。一个是文档和主题之间的概率,另一个是单词和主题之间的概率。不过,我其实不知道怎么用这些结果来预测一篇新文档的主题。我在使用吉布斯采样(Gibbs sampling)。有没有人知道该怎么做?谢谢!

1 个回答

3

这个Java实现的代码可以在这个链接找到:http://www.arbylon.net/projects/lda-j/lda-j-src-20050325.zip。里面有一个简单的示例程序,路径是src\org\knowceans\lda\SearchEnglet.java。希望你对Java有一点了解,这段代码能对你有所帮助。

原始论文的内容可以在这里查看:http://jmlr.csail.mit.edu/papers/volume3/blei03a/blei03a.pdf,其中第5.1和5.2节讲述了推理的相关内容。

撰写回答