python 2和3通用编码检测器
charade的Python项目详细描述
字符:通用字符编码检测器
- 检测
- ascii、utf-8、utf-16(2种变体)、utf-32(4种变体)
- big5、gb2312、euc-tw、hz-gb-2312、iso-2022-cn(繁体和简体中文)
- EUC-JP,班次JIS,ISO-2022-JP(日语)
- EUC-KR、ISO-2022-KR(朝鲜语)
- KOI8-R、MacCyrillic、IBM855、IBM866、ISO-8859-5、Windows-1251(西里尔文)
- ISO-8859-2,Windows-1250(匈牙利语)
- ISO-8859-5,Windows-1251(保加利亚语)
- Windows-1252(英语)
- ISO-8859-7,Windows-1253(希腊语)
- ISO-8859-8,Windows-1255(可视和逻辑希伯来语)
- TIS-620(泰语)
需要Python2.6或更高版本
命令行工具
chardet附带了一个命令行脚本,它报告一个 或更多文件:
% charade somefile someotherfile somefile: windows-1252 with confidence 0.5 someotherfile: ascii with confidence 1.0
关于
这是一个港口的马克朝圣者的优秀查德。前两个版本 需要维护:一个支持Python2.x,另一个支持 python 3.x.在这个端口上做了少量的工作,现在就开始猜字谜 在一个代码库中支持两者。
这项工作的基础是马克最后一个可用的chardet源 Python3000。
原因
一切都有原因吗?不,但在这种情况下,原因是 帮助requests和其他任何痛苦的人 需要这个。
X、Y或Z呢?
如果x、y或z(可能做同样事情的其他项目的口语) 确实存在,确实存在于查拉德之前,我对他们感到失望。 并没有让他们更出名。这会让我省下不少时间。
maintainer: | Ian Cordasco |
---|
1.0.3–2012年1月17日
- 将chardet.py脚本重命名为charade