纠正英语拼写错误并规范化。(例如,“coooooooooolllllllllllll”到“cool”)

pytypo的Python项目详细描述


pytypo

travis-ci.orgcoveralls.ioCode Healthpyversionlatest versionlicense

pytypo纠正英语拼写错误。 这个特性是基于打字语料库(http://luululu.com/tweet/) 和维基百科(https://en.wikipedia.org/wiki/Wikipedia:Lists_of_common_misspellings/For_machines

该模块还规范化了带有重复字母的加长英语表达式。 (例如,此模块将“coooooooooolllllllll”转换为“cool”)

该功能基于以下文件: 塞缪尔·布罗迪和尼古拉斯·迪亚科普洛斯。 太棒了!!!!!!!!!!!!!!使用词加长来检测微博中的情感。 见EMNLP2011,第562-5702011页。 http://aclweb.org/anthology//D/D11/D11-1052.pdf

欢迎投稿!

安装

$ pip install pytypo

用法

导入pytypo

>>> import pytypo

正确句子

>>> pytypo.correct_sentence('you are coooolll!!!')
you are cool!
  • 正确的句子(str)

正确单词

>>> pytypo.correct('okayyyyy')
okay
  • 正确(str)

缩短重复的子串,直到没有字典的threshold

>>> pytypo.cut_repeat('mamisaaaaaan', 1)
mamisan
>>> pytypo.cut_repeat('okayyyyy', 2)
okayy
  • 重复切割(str,threshold)
    • 注意,此方法不使用加长表达式normalize table(例如,cooll-&g t;cool)。 如果要规范化此类表达式,请使用correct()correct嫒sentence()方法。

许可证

  • 这个模块是根据麻省理工学院的许可证授权的。

更改

0.3(2017-10-18)

从维基百科添加许多案例

0.2(2016-04-15)

添加许多案例

0.1(2016-04-14)

第一次释放。

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
如何下载多个。java中的PDF文件   linux Java打开文件,形成实际用户主页~/   java如何在时间线内维护TableView选择?   java Hibernate注释@Where vs@WhereJoinTable   Java读/写访问异常FileNotFoundException(访问被拒绝)   继承在Java中是否可以扩展最后一个类?   Android HttpClient使用java使应用程序崩溃。lang.OutOfMemoryError:pthread_create   java为什么即使我在proguardproject中添加了jar文件,也会出现这种错误。txt?   如果添加JButton,swing Java FocusListener和KeyListener将无法工作   java使用solrj检索json格式的SolrDocument   使用Microsoft Visual Studio代码进行Java编程   java NoClassDefFoundError:org/apache/log4j/Logger   哈希集中包含相等对象的java   java中的参数化构造函数是否需要有一个主体?   java类似于NetBeans不必要的代码检测器   Java实践问题   java Blackberry“[projectname].调试文件丢失”和“I/O错误:找不到程序”jar