基于话题建模的句子话题预测
sptm的Python项目详细描述
sptm:使用主题建模的句子主题预测
快速运行
sptm是一个高级api,用python编写,能够使用Gensim和MALLET训练主题模型。它是在@Anupam Mediratta的指导下作为暑期实习项目开发的。该软件包的设计重点是实现快速实验。能够以尽可能少的延迟从一个想法转到另一个结果是做好研究的关键。
如果您需要的库:
- 允许轻松快速的主题模型培训
- 绘制主题间距离图
- 为主题构造条件概率矩阵
- 预测句子主题
阅读位于[sptm_source]/docs/u build/html/index.html的文档。
sptm与python 3.7兼容(经过测试)。
关于sptm的一些好东西
用户友好。源代码很容易理解
模块化。只要gensim支持,您就可以使用自己的模型、训练算法等。
入门:距SPTM 30秒
在存储库的test folder中,您将发现一个脚本几乎使用了所有类和函数。
安装
- 重要
SPTM使用的木槌的安装步骤可以找到here。
只有当您想使用gensim的ldamallet包装器(sptm中使用的默认训练算法)训练主题模型时,才需要使用该包装器。
然后,您可以安装SPTM本身。安装SPTM有两种方法:
- install sptm from pypi(推荐):
sudo pip3 install sptm
如果您使用的是virtualenv,则可能需要避免使用sudo:
pip3 install sptm
- 或者:从github源安装sptm:
首先,使用git
:
git clone https://github.com/Rochan-A/sptm.git
然后,cd
到sptm文件夹并运行install命令:
cd sptm
sudo python3 setup.py install
- 注意:您需要特别下载Spacy的en_core_web_sm模型。
无论安装方法如何,都需要执行此步骤。
您可以通过运行:
python3 -m spacy download en_core_web_sm
支架
您可以在GitHub issues中发布bug报告和功能请求。确保先阅读guidelines。
为什么叫它SPTM?
sptm代表使用主题建模的-句子主题预测
为什么这个自述文件奇怪地熟悉?
本自述文件是经过大量编辑的keras's