纯python模块连接文本

Pyphen的Python项目详细描述


Pyphen是一个纯python模块,用现有的HunScript来连接文本。 断字词典。

https://github.com/Kozea/Pyphen

这个模块是由wilbert berendsen编写的python断字器的叉。

https://code.google.com/p/python-hyphenator/

很多字典都包含在pyphen中,它们来自libreoffice git 存储库,并在gpl、lgpl和/或mpl下分发。见 字典和libreoffice的存储库了解更多详细信息。

http://cgit.freedesktop.org/libreoffice/dictionaries/tree/

用法:

>>> import pyphen
>>> pyphen.language_fallback('nl_NL_variant1')
'nl_NL'
>>> 'nl_NL' in pyphen.LANGUAGES
True
>>> dic = pyphen.Pyphen(lang='nl_NL')
>>> dic.inserted('lettergrepen')
'let-ter-gre-pen'
>>> dic.wrap('autobandventieldopje', 11)
('autoband-', 'ventieldopje')
>>> for pair in dic.iterate('Amsterdam'):
...     print(pair)
...
('Amster', 'dam')
('Am', 'sterdam')
>>>

功能:

  • 100%纯python,无依赖关系
  • 包括许多词典
  • 缓存dict文件和连字符单词
  • 支持非标准连字符模式

许可证:

Pyphen是在GPL 2.0+/LGPL 2.1+/MPL 1.1三方许可下发布的。 有关详细信息,请参见copying.gpl、copying.lgpl和copying.mpl。

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java Android Emulator无法运行   java Date()构造函数如何返回值   安卓客户端和java tcp   将Scala应用程序与NewRelic Java代理集成   java Spring启动控制器应该如何处理“丢失”的请求头?   javajackson将整数解析为双精度   oop如何直接访问minheap中的对象,java   java maven安装仅在第二次尝试后抛出“打开zip文件时出错”   OpenLayers的api Java等价物   java如何在给定修改字符串的方法的情况下,将修改后的字符串反转回MD5哈希?   java在Eclipse控制台中没有字符的输出。最小值   java获取偶数或奇数   java从外部片段内FragmentTabHost的子片段添加新选项菜单   http状态代码404 HTTPURLConnection。getContent java。伊奥。FileNotFoundException   对getText()的java调用未在Android应用程序中编译   从httpservlet请求体读取java缩进xml?   java Android REST客户端,示例?   java Google数据存储无主OnetoMany关系   java在SpringMVC中执行jdbc调用