用于主题建模和可视化的库。

dariah的Python项目详细描述


dariah topics是一个易于使用的python库,用于主题建模和可视化。开始是非常容易的。你所要做的就是导入库——你可以直接从原始文本文件中训练一个模型。

它支持latent Dirichlet allocation

的两种实现
  • 基于cython的轻量级包lda
  • 更健壮、基于java的包MALLET

安装

$ pip install dariah

示例

>>> import dariah
>>> dariah.topics(directory="british-fiction-corpus",
...               stopwords=100,
...               num_topics=10,
...               num_iterations=1000)

开发

Poetry自动创建虚拟环境,生成项目并将其发布到PyPI。使用以下命令安装依赖项:

$ poetry install

运行测试:

$ poetry run pytest

格式代码:

$ poetry run black dariah

建立项目:

$ poetry build

并在PyPI

$ poetry publish

关于Dariah-de

DARIAH-DE以数字方法和程序支持人文科学研究。DARIAH-de的研究基础设施由四个支柱组成:教学、研究、研究数据和技术部分。作为DARIAH-EU的合作伙伴,Dariah-de帮助捆绑和网络数字人文学科的最新活动。例如,科学家们利用达里亚(dariah)技术,在整个欧洲范围内提供研究数据。因此,促进了跨学科的知识和专门知识交流,并鼓励发现新的科学话语的可能性。

这个软件库是在dariah-de倡议(dariah-de initiative)、dariah-eu德国分部(dariah-eu)和欧洲艺术和人文数字研究基础设施联合会的支持下开发的。德国联邦研究和教育部(BMBF)以01UG1610J的身份提供了资金。

https://raw.githubusercontent.com/DARIAH-DE/Topics/master/docs/images/dariah-de_logo.pnghttps://raw.githubusercontent.com/DARIAH-DE/Topics/master/docs/images/bmbf_logo.png

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
从数组返回类类型的java   关于Executor服务的java澄清   java在Eclipse中找不到快捷菜单   如何在java中只打印时间?   创建不可由GC收集的java类   java有向边图的逆   java Dijital海洋空间列表对象不工作   java Play 1.2.4 findByID不适用于复合Id   如何在Java中使用switch语句添加两个整数   我的log4jjava问题。lang.ClassNotFoundException:=org。阿帕奇。log4j。滚动文件   Springboot 2.4.0RC1和SpringCloud配置(Illford)java。lang.VerifyError:无法从最终类继承   java如何使方法线程安全   使用自定义SSL配置的java启动WebLogic服务器   java缺少右括号   如何在Java中使用Rally Rest API获取测试集ID?