只需一个文档列表(例如csv/txt格式的twitter帖子列表)就可以轻松构建lda主题模型
easyLDA的Python项目详细描述
easylda是一个很容易构建lda主题模型的库,只需一个文档列表(例如csv/txt格式的twitter帖子列表)
Github:https://github.com/shichaoji/easyLDA
- 如果您有一个文档集合,以及 文档的关系和主题,easylda是一个非常方便的库 使用。只要运行推荐,您就可以得到一个经过培训的lda模型 结果可视化
安装
$ pip install easyLDA
用法示例
简单需要一个文本文件(.csv),每一行代表一个文档(帖子、评论、短文等),只有一列文本
文本文件(CSV)示例视图
简单易用,只需在shell窗口中键入:easylda,然后指定文本文档的位置
一。然后选择希望模型适合的主题数
2.选择主题只包含一个单词(1)或可以是阶段(2/3)以及
程序将开始训练
- 外壳$easylda