用于主题建模和可视化的库。
dariah的Python项目详细描述
dariah topics是一个易于使用的python库,用于主题建模和可视化。开始是非常容易的。你所要做的就是导入库——你可以直接从原始文本文件中训练一个模型。
它支持latent Dirichlet allocation:
的两种实现安装
$ pip install dariah
示例
>>> import dariah >>> dariah.topics(directory="british-fiction-corpus", ... stopwords=100, ... num_topics=10, ... num_iterations=1000)
开发
Poetry自动创建虚拟环境,生成项目并将其发布到PyPI。使用以下命令安装依赖项:
$ poetry install
运行测试:
$ poetry run pytest
格式代码:
$ poetry run black dariah
建立项目:
$ poetry build
并在PyPI:
$ poetry publish
关于Dariah-de
DARIAH-DE以数字方法和程序支持人文科学研究。DARIAH-de的研究基础设施由四个支柱组成:教学、研究、研究数据和技术部分。作为DARIAH-EU的合作伙伴,Dariah-de帮助捆绑和网络数字人文学科的最新活动。例如,科学家们利用达里亚(dariah)技术,在整个欧洲范围内提供研究数据。因此,促进了跨学科的知识和专门知识交流,并鼓励发现新的科学话语的可能性。
这个软件库是在dariah-de倡议(dariah-de initiative)、dariah-eu德国分部(dariah-eu)和欧洲艺术和人文数字研究基础设施联合会的支持下开发的。德国联邦研究和教育部(BMBF)以01UG1610J的身份提供了资金。