韩语屈折范式生成器

koparadigm的Python项目详细描述


koparadigm:韩语屈折范式生成器

(屈折)范式是指一个词所有屈折形式的集合。例如,如大家所知,英语动词“look”有“look”、“look-s”、“look-ed”和“look-ing”等屈折形式。 范式在语料库语言学或搜索引擎中有着广泛的应用。 创建一种语言的完整范例集有时是很棘手的。尤其是当我们处理像韩国语这样形态丰富的语言时。 韩国动词的屈折变化是众所周知的复杂。通常,一个韩语动词可以有超过100个结尾。更糟糕的是,组合规则一点也不简单。 它们由动词/结尾的声音和动词的词性(动作/描述性)决定。这就是为什么到目前为止还没有开源的韩国范式生成器,我想。 这是第一个。有了koparadigm,你可以很容易地得到一个韩语动词的完整范例。

依赖关系

  • python=3.6
  • Jamo=0.4.1
  • xlrd>;1.2.0

安装

pip install koparadigm

用法

>>> from koparadigm import Paradigm
>>> p = Paradigm()

>>> verb = "곱" # Note that you must drop the final ending 다
>>> paradigms = p(verb) # this returns list of lists
>>> print(paradigms)
[['동사', OrderedDict([('는다', '곱는다'), ('는다고', '곱는다고'), ('는다나', '곱는다나'), ('는다네', '곱는다네'), ('는다더라', '곱는다더라'), ('는다느니', '곱는다느니'), ('는다마는', '곱는다마는'), ('는다손', '곱는다손'), ('는담', '곱는담'), ('는답시고', '곱는답시고') ...
['형용사', OrderedDict([('습네', '곱습네'), ('습늰다', '곱습늰다'), ('습니까', '곱습니까'), ('습니다', '곱습니다'), ('습디까', '곱습디까'), ('습디다', '곱습디다'), ('습딘다', '곱습딘다'), ('습지요', '곱습지요'), ('으나', '고우나') ...]]
>>> for paradigm in paradigms:
...     print("pos =", paradigm[0])
...     for ending, form in paradigm[1].items():
...         print("ending =", ending, "form =", form)
...     print()
pos = 동사
ending = 는다 form = 곱는다
ending = 는다고 form = 곱는다고
ending = 는다나 form = 곱는다나
...

pos = 형용사
ending = 습네 form = 곱습네
ending = 습늰다 form = 곱습늰다
ending = 습니까 form = 곱습니까
...

参考文献

如果您使用我们的软件进行研究,请引用:

@misc{KoParadigm2019,
  author = {Park, Kyubyong },
  title = {KoParadigm},
  year = {2019},
  publisher = {GitHub},
  journal = {GitHub repository},
  howpublished = {\url{https://github.com/Kyubyong/paradigm}}
}

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java Android BLE连接参数和在SQLite数据库中存储BLE传感器数据   JavaEclipseRCP在整个应用程序启动并且GUI完全呈现之后运行基于E4的代码   在Java中使用大型内部类是否不好?   java找不到类“org”。格威茨。客户临时雇员TMouseListenerCollection'   java创建同名的新ArrayList表现不同   java删除包含两个子节点的二叉树节点   java从int中获取第二个数字   java越界错误,而不是自定义消息   具有数据绑定的java Room注释处理器;无法找到符号类BR   无法使用java将命令写入共享位置上的exe程序   java Lucene:将带有ORs的布尔查询转换为只包含ANDs的查询   java高效地渲染世界风中的大量多边形