西班牙语单词的自动音节划分

pylabeador的Python项目详细描述


codecov

Pylabeador:西班牙语单词的自动音节化

安装

pip install pylabeador

使用

可以将其用作Python库:

^{pr2}$

您可以将其用作命令行工具:

$ pylabeador interesante
in-te-re-san-te

准确度

没有额外的词汇或语义知识的自动音节化只能走到这一步。这个教学大纲没有这样的知识。因此,诸如transatlántico,其正确的连字符是trans-a-tlán-ti-co甚至trans-at-tlán-ti-co,在这里最终被分成tran sa tlán-ti-co。为了正确地使用连字符,必须知道西班牙语中没有前缀的单词与原始单词的语义相似。这一点在本文中得到了更好的解释:Automatic syllabification for Spanish using lemmatization and derivation to solve the prefix’s prominence issue

灵感/来源

这项工作的灵感来自于优秀的在线工具Silabeador TIP。这个工具考虑单词的语义,并在有前缀的情况下正确地分隔音节。他们还提供了一个C++库,执行了{eM1}$PyLabeAdor EEE>的天真音节分离。事实上,pyleabeador是从该库的Python端口开始的。在

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
JavaSpringMVC控制器测试打印结果JSON字符串   若catch语句返回,那个么为什么它最终会阻塞呢?   java Grails中servletContext在哪里可用?   java Jhipster:如何为现有项目启用多种语言   java异常评估SpringEL表达式:“#fields.hasErrors('something')”   java如何验证SeleniumWebDriver中的文本颜色?   java在绘图时使用JPanel坐标   java如何初始化spring启动到project?   java如何通过JDBC的PreparedStatement将UUID数组插入HyperSQL数据库   java修改JVM以跨线程序列化文件访问   Javascript到Java正则表达式   使用Java运行时调用aspell程序时出现字符集问题。getRuntime()。执行官   执行RDP时的java Sukuli按钮识别   java如何使用okhttp更改connect请求的标头   java无法创建Maven Eclipse项目