基于wikipedia的regextypofix,使用正则表达式修复文本中的拼写错误
top的Python项目详细描述
topy(typo的anagram)是一个python脚本,使用由RegExTypoFix项目开发的规则集修复文本中的typo 来自维基百科。英语规则集包含在topy中,默认情况下使用。其他规则集可以手动 下载
topy可以与python 2或3一起工作。
最简单的安装方法是使用pip:
pip install topy
用法:
Usage: topy [options] FILES/DIRS... Options: -h, --help show this help message and exit -q, --quiet silence information messages -a, --apply overwrite files in place -r FILE, --rules=FILE specify custom ruleset file to use
资源
变更日志
0.2.2(2016-12-16)
- 更新捆绑规则集
- 正式添加Python3.6支持
0.2.1(2016-07-15)
- 更新捆绑规则集
- 更新regex依赖项版本以避免regex issue #216
- 正式添加Python3.5支持
0.2.0(2015-09-09)
- python 2上使用unicode的几个修复程序
- 可以安全地处理Unicode无效的文件名
- 更新捆绑规则集
- 修复使用过的库中的一些警告
0.1.0(2014-08-24)
- 首次公开发行
贡献
代码样式:
- 一般遵循python PEP-8编码风格,但行长度最多可以达到120个字符。
- 对人类有意义的字符串使用双引号("),否则使用单引号(')。有疑问时,不要 别担心。
- 代码应该与Python2和3兼容,最好没有特定于版本的条件。
使用python setup.py test运行测试套件。
在github上以请求方式提交更改。
许可证
Topy软件是在麻省理工学院的许可下授权的(请参见license.txt)
捆绑的retf.txt文件,由wikipedia贡献者从Wikipedia:AutoWikiBrowser/Typos复制,已获得许可 在CC-BY-SA下面。有关作者信息,请参见维基百科上的页面。