两种语言注释格式之间的转换:folia和naf

NAFFoLiA的Python项目详细描述


用于在folia和naf之间转换的python库和命令行工具。

安装

要克隆此存储库并进行安装,请执行以下操作:

  • $ git clone https://github.com/cltl/NAFFoLiAPy.git
  • $ cd NAFFoLiAPy
  • $ python3 install setup.py

您可能需要为python 2.7使用python2,并且可能需要包含sudo 如果要全局安装包。我们建议使用python virtualenv不过。在执行之前创建并激活一个 以上步骤:

  • $ virtualenv --python=python3 naffoliaenv
  • $ . naffoliaenv/bin/activate

或者,使用像anaconda这样的python发行版。

NaF到叶面

naf2folia当前支持以下转换:

  • 原始文本
  • 代币和条款
    • 尚未支持多令牌条款!
    • 在转换过程中保留偏移信息
  • 词性
    • naf的形态句法特征(morphofeat)被转换为第二类词类(不同集合)。
  • 引理
  • 词汇语义意义(纳夫河的WordNet外部引用)< /dt >
    • 在NAF中,这些是关于术语的外部参考
    • 只有已知资源才支持转换为叶感。
    • 嵌套的外部引用使用folia的特征机制表示。
  • 命名实体
    • NAF的“实体”图层中的外部参照将转换为叶面路线。
  • 标记
    • 转换为叶实体
    • naf的markables层中的外部参照将转换为folia对齐
  • 共同引用和事件作为共同引用
  • 语义角色和谓词
    • 谓词级别上的外部引用(通常为framenet)转换为folia sense
  • 依赖关系
  • 时间表达式
    • 时间表达式转换为叶实体
  • 情绪分析(意见层)
  • 元数据
    • folia的原生元数据方案用于转换naf的fileDescpublic元素中的信息。
    • 来自语言预处理器的信息尚未转换。

尚未列出的任何内容都不受支持。工具会在任何时候发出警告 遇到一些它还不能尽可能多地转换的东西,但这是 不能保证。

叶面至naf

folia2naf当前支持以下转换:

  • 原始文本(从标记创建)
  • 文字到文字和术语
    • NAF捕获未考虑的多个令牌的可能性
    • 偏移量和长度来自字符串和空格信息
    • 词性:
      • 取自pos元素:naf的morphofeat=folia的pos类,naf的pos=folia的pos头
    • 引理
    • 实体
    • 依赖关系

尚未列出的任何内容都不受支持

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java应该考虑使用DTO来代替Spring控制器层吗?   java为什么要将Maven与Git结合起来?   java试图将CSV转换为XLSX,但使用了错误的逗号拆分列   mysql Spring 3+Hibernate:java。sql。BatchUpdateException:无法添加或更新子行(ManyToMany)   java基本字符串反转器   java无法使用RestControllerAdvice为身份验证失败生成自定义错误消息   java当只允许SQLException时,如何抛出EOFEException?   java如何创建播放模块?   Android中匿名类的java实例化异常问题   java两个停靠组件,其中第二个组件填充剩余空间   java如何在按钮延迟时启用它   Java中正在运行的应用程序中的后台进程   java我正试图从一个字符串打印出这个字符输出   如何使用java socket通过两个不同的wifi连接两台电脑?   javaapachecamel:如何将分层数据从数据库转换为pojo   java Webrtc:OniconConnectionChange和onConnectionChange之间有什么区别   java如何重写已经创建的JTable方法   爪哇扫雷机堆垛机   雅加达ee Java ee EJB 3.0 Glassfish