自动主题索引和分类工具
annif的Python项目详细描述
安宁
ANNIF是一个自动主题索引工具包。它最初创建为 一种使用来自元数据的统计自动索引工具 Finna.fi作为训练语料库的发现接口。
此回购协议包含基于 prototype。这是一项正在进行的工作,但是 已经可以执行许多常见任务。
基本安装
安装annif需要python 3.5+。
建议的方法是从 PyPI进入虚拟环境。
python3 -m venv annif-venv
source annif-venv/bin/activate
pip install annif
您还需要nltk数据文件:
python -m nltk.downloader punkt
启动应用程序:
annif
见Getting Started 在wiki中获取更多详细信息。
开发安装
可以通过克隆GitHub repository来安装annif的开发版本。 Pipenv用于管理 开发版本。
安装和设置
克隆存储库。
切换到存储库目录。 如果没有pipenv,请安装它:
pip install pipenv # or pip3 install pipenv
安装依赖项并下载nltk数据:
pipenv install # use --dev if you want to run tests etc.
进入虚拟环境:
pipenv shell
您还需要nltk数据文件:
python -m nltk.downloader punkt
启动应用程序:
annif
单元测试
运行pipenv shell
进入虚拟环境,然后运行pytest
。
要让测试套件监视代码的更改并自动运行,请使用
通过运行ptw
来测试监视。
许可证
此存储库中的代码是根据ApacheLicense2.0授权的,除了
依赖项包括在annif/static/css
和annif/static/js
下,
他们有自己的执照。有关详细信息,请参见文件头。