韩语屈折范式生成器
koparadigm的Python项目详细描述
koparadigm:韩语屈折范式生成器
(屈折)范式是指一个词所有屈折形式的集合。例如,如大家所知,英语动词“look”有“look”、“look-s”、“look-ed”和“look-ing”等屈折形式。 范式在语料库语言学或搜索引擎中有着广泛的应用。 创建一种语言的完整范例集有时是很棘手的。尤其是当我们处理像韩国语这样形态丰富的语言时。 韩国动词的屈折变化是众所周知的复杂。通常,一个韩语动词可以有超过100个结尾。更糟糕的是,组合规则一点也不简单。 它们由动词/结尾的声音和动词的词性(动作/描述性)决定。这就是为什么到目前为止还没有开源的韩国范式生成器,我想。 这是第一个。有了koparadigm,你可以很容易地得到一个韩语动词的完整范例。
依赖关系
- python=3.6
- Jamo=0.4.1
- xlrd>;1.2.0
安装
pip install koparadigm
用法
>>> from koparadigm import Paradigm
>>> p = Paradigm()
>>> verb = "곱" # Note that you must drop the final ending 다
>>> paradigms = p(verb) # this returns list of lists
>>> print(paradigms)
[['동사', OrderedDict([('는다', '곱는다'), ('는다고', '곱는다고'), ('는다나', '곱는다나'), ('는다네', '곱는다네'), ('는다더라', '곱는다더라'), ('는다느니', '곱는다느니'), ('는다마는', '곱는다마는'), ('는다손', '곱는다손'), ('는담', '곱는담'), ('는답시고', '곱는답시고') ...
['형용사', OrderedDict([('습네', '곱습네'), ('습늰다', '곱습늰다'), ('습니까', '곱습니까'), ('습니다', '곱습니다'), ('습디까', '곱습디까'), ('습디다', '곱습디다'), ('습딘다', '곱습딘다'), ('습지요', '곱습지요'), ('으나', '고우나') ...]]
>>> for paradigm in paradigms:
... print("pos =", paradigm[0])
... for ending, form in paradigm[1].items():
... print("ending =", ending, "form =", form)
... print()
pos = 동사
ending = 는다 form = 곱는다
ending = 는다고 form = 곱는다고
ending = 는다나 form = 곱는다나
...
pos = 형용사
ending = 습네 form = 곱습네
ending = 습늰다 form = 곱습늰다
ending = 습니까 form = 곱습니까
...
参考文献
如果您使用我们的软件进行研究,请引用:
@misc{KoParadigm2019,
author = {Park, Kyubyong },
title = {KoParadigm},
year = {2019},
publisher = {GitHub},
journal = {GitHub repository},
howpublished = {\url{https://github.com/Kyubyong/paradigm}}
}