一个处理folia文档的扩展库。folia代表语言注释的格式,是各种自然语言处理工具使用的非常丰富的基于xml的格式。
FoLiA的Python项目详细描述
这个python模块提供了一个扩展的库,用于解析、创建和处理Format for Linguistic Annotation,也就是FoLiA中的文档。它有 自2010年以来一直在积极开发中,并被许多自然语言处理(NLP)工具所使用。
这个库以前是PyNLPL(pynlpl.formats.folia)的一部分,但现在是 在迁移到它自己的(即这个)项目的过程中。
确认
Folia Development的资金来源于更大的Clarin-NL项目及其继任者Clariah。
提供以下模块:
- folia.main-主库
- folia.setdefinition-用于叶集定义的模块
- folia.fql-支持folia查询语言(fql)
安装
直接从python包下载并安装最新的稳定版本 使用pip install folia(或pip3为python 3编制索引 系统)。对于全局安装,请在sudo之前。
或者,克隆此存储库并运行python setup.py install(或 python3 setup.py install适用于大多数系统上的python 3。在sudo前添加 全球安装。
python folia库也包含在我们的LaMachine发行版中。
文档
可以找到api文档和教程here。