来自h.schmid的treetagger文本注释工具的包装器。

treetaggerwrapper的Python项目详细描述


Author:Laurent Pointal <laurent.pointal@limsi.fr> <laurent.pointal@laposte.net>
Organization:CNRS - LIMSI
Copyright:CNRS - 2004-2019
license:GNU-GPL Version 3 or greater
Version:2.3

这是什么?

本模块包装了Helmut Schmid语言的独立词类 将统计标记符放入python类中,允许标记 几篇课文一个接一个,与《圣经》保持同步。 加速处理的进程(删除外部Perl脚本依赖项 用于分块)。

使用对象,可以同时启动多个标记,最终使用 不同的语言。

支持分块:

  • 英语
  • 法语
  • 德语
  • 西班牙语

支持对treetagger支持的语言进行标记,但必须 如果需要,您必须指定参数 文件通过选项。

这个版本已经被修改为使用python2和python3运行(谢谢您的6个版本) 全球范围内重新设计,修复了缺陷。

安装

除非有人为你的os发行版构建了一个包,否则最简单的过程 使用pip安装模块:

pip install treetaggerwrapper

如果您没有管理员权限在计算机上安装,则可以安装 一个virtual env并在这个虚拟环境中运行pip,或者您可以做一个本地用户 安装:

pip install –user treetaggerwrapper

可以使用pip3来安装python3。

您还需要安装treetagger…

treetagger

Treetager本身可免费用于研究、教育和评估。 见TreeTagger page

有一个基于脚本的安装过程,您可以在其中下载所需的文件 在要安装treetagger的目录中,包括安装 脚本,然后启动脚本以解压缩并在右侧安装正确的文件 具有正确名称的目录。

对于windows用户,有一个可下载的windows二进制文件,但没有安装脚本。 你必须下载treetagger参数文件(因为treetagger是utf-8 在Linux和Windows上是相同的),解压缩并安装在右侧 使用正确的名称放置(lib/)(您可以在 treetaggerwrapper.py全局用语g_langsupport, 在键tagparfileabbrevfile中。

如果您在一个公共的地方安装treetagger,通常会有一个工作自动检测 在treetaggerwrapper内。 但是如果你把它安装在一个特殊的地方或者用一个特殊的名字,你会 将此安装目录提供给模块(请参见文档中的TAGDIR)。

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java如何使用Scanner用文件中的文本填充数组,然后从数组中随机选择文本?   java如何在windows中使用BlueJ进行无限缓冲   java为什么JPA中存在“太多连接”?   java如何在recyclerview中创建和填充公共字段?   当我在Google Play上发布应用程序时,很多设备都不支持java xWalkWebView 64位   HTML文档文本中位置或偏移量的java含义   java如何在JTextArea中打开文件,并使用FileReader和FileWriter类进行读写   java`elementtobelickable`只是检查它是否可见并已启用   安卓中图像下方的java绘图文本   java我如何为我的Android应用程序启用Google signin,使其只允许来自特定Google域的用户?   在超级Java调用中调用父级的内部类   java在没有定时器的情况下运行代码   java使用hashset值作为hashmap中的键   java我需要为我的应用程序获取API密钥,为此,我需要证书的MD5签名   java编写一个方法来查看字符串x是否包含字母“G”