西班牙语单词的自动音节划分
pylabeador的Python项目详细描述
Pylabeador:西班牙语单词的自动音节化
安装
pip install pylabeador
使用
可以将其用作Python库:
^{pr2}$您可以将其用作命令行工具:
$ pylabeador interesante in-te-re-san-te
准确度
没有额外的词汇或语义知识的自动音节化只能走到这一步。这个教学大纲没有这样的知识。因此,诸如transatlántico,其正确的连字符是trans-a-tlán-ti-co甚至trans-at-tlán-ti-co,在这里最终被分成tran sa tlán-ti-co。为了正确地使用连字符,必须知道西班牙语中没有前缀的单词与原始单词的语义相似。这一点在本文中得到了更好的解释:Automatic syllabification for Spanish using lemmatization and derivation to solve the prefix’s prominence issue
灵感/来源
这项工作的灵感来自于优秀的在线工具Silabeador TIP。这个工具考虑单词的语义,并在有前缀的情况下正确地分隔音节。他们还提供了一个C++库,执行了{eM1}$PyLabeAdor EEE>的天真音节分离。事实上,pyleabeador是从该库的Python端口开始的。在
- 项目
标签: