两种语言注释格式之间的转换:folia和naf
NAFFoLiA的Python项目详细描述
用于在folia和naf之间转换的python库和命令行工具。
安装
要克隆此存储库并进行安装,请执行以下操作:
- $ git clone https://github.com/cltl/NAFFoLiAPy.git
- $ cd NAFFoLiAPy
- $ python3 install setup.py
您可能需要为python 2.7使用python2,并且可能需要包含sudo 如果要全局安装包。我们建议使用python virtualenv不过。在执行之前创建并激活一个 以上步骤:
- $ virtualenv --python=python3 naffoliaenv
- $ . naffoliaenv/bin/activate
或者,使用像anaconda这样的python发行版。
NaF到叶面
naf2folia当前支持以下转换:
- 原始文本
- 代币和条款
- 尚未支持多令牌条款!
- 在转换过程中保留偏移信息
- 词性
- naf的形态句法特征(morphofeat)被转换为第二类词类(不同集合)。
- 引理
-
词汇语义意义(纳夫河的WordNet外部引用)< /dt >
- 在NAF中,这些是关于术语的外部参考
- 只有已知资源才支持转换为叶感。
- 嵌套的外部引用使用folia的特征机制表示。
- 命名实体
- NAF的“实体”图层中的外部参照将转换为叶面路线。
- 标记
- 转换为叶实体
- naf的markables层中的外部参照将转换为folia对齐
- 共同引用和事件作为共同引用
- 块
-
语义角色和谓词
- 谓词级别上的外部引用(通常为framenet)转换为folia sense
- 依赖关系
- 时间表达式
- 时间表达式转换为叶实体
- 情绪分析(意见层)
- 元数据
- folia的原生元数据方案用于转换naf的fileDesc和public元素中的信息。
- 来自语言预处理器的信息尚未转换。
尚未列出的任何内容都不受支持。工具会在任何时候发出警告 遇到一些它还不能尽可能多地转换的东西,但这是 不能保证。
叶面至naf
folia2naf当前支持以下转换:
- 原始文本(从标记创建)
- 文字到文字和术语
- NAF捕获未考虑的多个令牌的可能性
- 偏移量和长度来自字符串和空格信息
- 词性:
- 取自pos元素:naf的morphofeat=folia的pos类,naf的pos=folia的pos头
- 引理
- 块
- 实体
- 依赖关系
尚未列出的任何内容都不受支持