只需一个文档列表(例如csv/txt格式的twitter帖子列表)就可以轻松构建lda主题模型

easyLDA的Python项目详细描述


PyPI version

easylda是一个很容易构建lda主题模型的库,只需一个文档列表(例如csv/txt格式的twitter帖子列表)

Github:https://github.com/shichaoji/easyLDA

  • 如果您有一个文档集合,以及 文档的关系和主题,easylda是一个非常方便的库 使用。只要运行推荐,您就可以得到一个经过培训的lda模型 结果可视化

库管道文本预处理,如tf-idf,gensim库的n-grams

记入:

https://radimrehurek.com/gensim/

http://pyldavis.readthedocs.io/en/latest/readme.html

安装

$ pip install easyLDA

用法示例

简单需要一个文本文件(.csv),每一行代表一个文档(帖子、评论、短文等),只有一列文本

文本文件(CSV)示例视图

Demo 1

简单易用,只需在shell窗口中键入:easylda,然后指定文本文档的位置

一。然后选择希望模型适合的主题数

2.选择主题只包含一个单词(1)或可以是阶段(2/3)以及

程序将开始训练

  • 外壳$easylda
Demo 2

模型结果

由程序创建的模型文件夹包含训练模型

html文件是模型结果的交互式可视化

Demo 3

静态pic结果

Demo 4

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java如何从通知中获取图像?   java按住按钮将循环一个动作,直到它被释放   JavaJavassist:如何将动态生成的类添加到特定的包中?   java我需要获取一个字符串并输出字符串中出现最多的单词   java合并排序堆栈溢出错误   java如何使用spring boot配置hibernate   Android中带选择器的Java TCP服务器NIO   java对于长度急剧变化的输入,什么是最佳的StringBuffer初始容量?   java SpringBoot:REST endpint中@RequestParam参数的自定义验证   JavaJPaQuery。fetchResults()已弃用,应如何替换它?   JavaJNA结构创建带来麻烦   java创建只包含响应中某些元素的POJO   java巨大的Perm Gen与应用程序大小相比,是否正常?   JavalibgdxMoveToAction。将setPosition()设置为负坐标,以将演员移出舞台