一个用于小型乌拉尔语的nlp库,如skolt sami、moksha等
uralicNL的Python项目详细描述
URALIC NLP是一个用于处理小型URALIC语言的Python库。目前支持的语言有斯科尔特萨米语、英格里安语、梅多东马里语、Votic语、Olonets Karelian语、Erzya语、Moksha语、Hill Mari语、Udmurt语、Tundra Nenets语、Komi Permyak语和芬兰语……
目前,该工具提供了使用sanat.csc.fi的api的uralicapi功能。通过这个api,可以对这些语言进行形态分析、形态生成、元素化和字典搜索。还可以将形态模型和约束语法下载到计算机中,以加快处理速度(有关更多信息,请参阅更多信息)。
这个库提供omorfi作为finnish的服务。
用法
^{tt1}$
^{tt2}$
^{tt3}$
^{tt4}$
^{tt5}$
^{tt6}$
^{tt7}$
^{tt8}$
^{tt9}$
更多信息
在Uralic NLP GitHub中提供了适当的文档 是的。
您可能还对using Korp on Python访问乌拉尔语语料库感兴趣。
随着我的博士研究的进展,这个图书馆在未来会有更多的功能。这个库和api是由Mika Hämäläinen创建的 是的。