来自h.schmid的treetagger文本注释工具的包装器。
treetaggerwrapper的Python项目详细描述
Author: | Laurent Pointal <laurent.pointal@limsi.fr> <laurent.pointal@laposte.net> |
---|---|
Organization: | CNRS - LIMSI |
Copyright: | CNRS - 2004-2019 |
license: | GNU-GPL Version 3 or greater |
Version: | 2.3 |
- Module documentation (在阅读文档时)。
- Subversion repository & bug tracking (在法国学术资料网站上)。
- Developer page
这是什么?
本模块包装了Helmut Schmid语言的独立词类 将统计标记符放入python类中,允许标记 几篇课文一个接一个,与《圣经》保持同步。 加速处理的进程(删除外部Perl脚本依赖项 用于分块)。
使用对象,可以同时启动多个标记,最终使用 不同的语言。
支持分块:
- 英语
- 法语
- 德语
- 西班牙语
支持对treetagger支持的语言进行标记,但必须 如果需要,您必须指定参数 文件通过选项。
这个版本已经被修改为使用python2和python3运行(谢谢您的6个版本) 全球范围内重新设计,修复了缺陷。
安装
除非有人为你的os发行版构建了一个包,否则最简单的过程 使用pip安装模块:
pip install treetaggerwrapper
如果您没有管理员权限在计算机上安装,则可以安装 一个virtual env并在这个虚拟环境中运行pip,或者您可以做一个本地用户 安装:
pip install –user treetaggerwrapper
可以使用pip3来安装python3。
您还需要安装treetagger…
treetagger
Treetager本身可免费用于研究、教育和评估。 见TreeTagger page。
有一个基于脚本的安装过程,您可以在其中下载所需的文件 在要安装treetagger的目录中,包括安装 脚本,然后启动脚本以解压缩并在右侧安装正确的文件 具有正确名称的目录。
对于windows用户,有一个可下载的windows二进制文件,但没有安装脚本。 你必须下载treetagger参数文件(因为treetagger是utf-8 在Linux和Windows上是相同的),解压缩并安装在右侧 使用正确的名称放置(lib/)(您可以在 treetaggerwrapper.py全局用语g_langsupport, 在键tagparfile和abbrevfile中。
如果您在一个公共的地方安装treetagger,通常会有一个工作自动检测 在treetaggerwrapper内。 但是如果你把它安装在一个特殊的地方或者用一个特殊的名字,你会 将此安装目录提供给模块(请参见文档中的TAGDIR)。