基于话题建模的句子话题预测

sptm的Python项目详细描述


sptm:使用主题建模的句子主题预测

sptm logo

license

快速运行

sptm是一个高级api,用python编写,能够使用GensimMALLET训练主题模型。它是在@Anupam Mediratta的指导下作为暑期实习项目开发的。该软件包的设计重点是实现快速实验。能够以尽可能少的延迟从一个想法转到另一个结果是做好研究的关键。

如果您需要的库:

  • 允许轻松快速的主题模型培训
  • 绘制主题间距离图
  • 为主题构造条件概率矩阵
  • 预测句子主题

阅读位于[sptm_source]/docs/u build/html/index.html的文档。

sptm与python 3.7兼容(经过测试)。


关于sptm的一些好东西

  • 用户友好。源代码很容易理解

  • 模块化。只要gensim支持,您就可以使用自己的模型、训练算法等。


入门:距SPTM 30秒

在存储库的test folder中,您将发现一个脚本几乎使用了所有类和函数。


安装

  • 重要

SPTM使用的木槌的安装步骤可以找到here

只有当您想使用gensim的ldamallet包装器(sptm中使用的默认训练算法)训练主题模型时,才需要使用该包装器。

然后,您可以安装SPTM本身。安装SPTM有两种方法:

  • install sptm from pypi(推荐):
sudo pip3 install sptm

如果您使用的是virtualenv,则可能需要避免使用sudo:

pip3 install sptm
  • 或者:从github源安装sptm:

首先,使用git

克隆sptm
git clone https://github.com/Rochan-A/sptm.git

然后,cd到sptm文件夹并运行install命令:

cd sptm
sudo python3 setup.py install
  • 注意:您需要特别下载Spacy的en_core_web_sm模型。

无论安装方法如何,都需要执行此步骤。

您可以通过运行:

python3 -m spacy download en_core_web_sm

支架

您可以在GitHub issues中发布bug报告和功能请求。确保先阅读guidelines


为什么叫它SPTM?

sptm代表使用主题建模的-句子主题预测

为什么这个自述文件奇怪地熟悉?

本自述文件是经过大量编辑的keras's


欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java正在转储大量的DataInputStreams,这是一种糟糕的做法吗?   java Android应用程序图标未出现在应用程序列表中   java Spring引导和Thymeleaf错误:无法分析异常   java如何在安卓 studio中显示日期选择器   java的C++ Web框架   eclipse在搜索以下位置后未找到Java虚拟机:   java hibernate HQL日期差异   java为什么我打印三角形数字的代码不起作用?   java RecyclerView:未连接适配器;登录时跳过布局   为什么JavaJSON返回这个错误?显然是在JSON反序列化中,但我找不到它发生的确切位置   正则表达式java短语的多次出现   有人能解释一下这些java泛型方法的声明吗?   aws lambda java。lang.IllegalStateException:未找到InjectionManagerFactory