只需一个文档列表(例如csv/txt格式的twitter帖子列表)就可以轻松构建lda主题模型

easyLDA的Python项目详细描述


PyPI version

easylda是一个很容易构建lda主题模型的库,只需一个文档列表(例如csv/txt格式的twitter帖子列表)

Github:https://github.com/shichaoji/easyLDA

  • 如果您有一个文档集合,以及 文档的关系和主题,easylda是一个非常方便的库 使用。只要运行推荐,您就可以得到一个经过培训的lda模型 结果可视化

库管道文本预处理,如tf-idf,gensim库的n-grams

记入:

https://radimrehurek.com/gensim/

http://pyldavis.readthedocs.io/en/latest/readme.html

安装

$ pip install easyLDA

用法示例

简单需要一个文本文件(.csv),每一行代表一个文档(帖子、评论、短文等),只有一列文本

文本文件(CSV)示例视图

Demo 1

简单易用,只需在shell窗口中键入:easylda,然后指定文本文档的位置

一。然后选择希望模型适合的主题数

2.选择主题只包含一个单词(1)或可以是阶段(2/3)以及

程序将开始训练

  • 外壳$easylda
Demo 2

模型结果

由程序创建的模型文件夹包含训练模型

html文件是模型结果的交互式可视化

Demo 3

静态pic结果

Demo 4

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java的单元测试测试用例库。util。列出实现   java通过超类进行序列化/反序列化   java Android获取设备语言ISO字符串   java如何打开广告的行动。移动   Eclipse IDE for(嵌入式C/C++)开发者202012:经典的深色主题深黑色背景和菜单中的文本   java使用不同的内容动态创建TableView(JavaFX)   java JAXB将多个同名节点解组   java ClassDefNotFoundException,即使类由类加载器加载(服务器上安装了多个应用程序)   java有没有办法关闭在后端生成的MqttClient线程?   html如何在网站上的java小程序中包含图像?   java无法访问已分配给超类引用的子类实例变量   java在TableViewer中双击打开对话框   列出如何创建ListNode。JAVA   java如何从文本中输出的数组中放入随机图像