使用gibbs采样执行潜在dirichlet分配的python库。
topic-modelling-tools的Python项目详细描述
#主题建模工具 基于gibbs抽样的潜在dirichlet分配主题建模
斯蒂芬·汉森,stephen.hansen@economics.ox.ac.uk 牛津大学经济学副教授
python/cython代码,用于清理文本并通过折叠gibbs采样估计lda,如griffiths和steyvers(2004)所述。
使用此库的教程脚本和笔记本,以及一些 示例数据,可在以下位置找到: https://github.com/sekhansen/text-mining-tutorial
##安装说明
如果已经安装了python和pip,那么pip安装主题建模工具应该可以工作。该包依赖于其他一些python库,如 Numpy和NLTK,但这应该由PIP负责。
唯一的另一个要求是,需要构建一个C++编译器来构建这个程序集。 代码。对于Mac OS X,您可以下载Xcode,而对于Windows,您可以下载 VisualStudio C++编译器。