python 2和3通用编码检测器

charade的Python项目详细描述


字符:通用字符编码检测器

检测
  • ascii、utf-8、utf-16(2种变体)、utf-32(4种变体)
  • big5、gb2312、euc-tw、hz-gb-2312、iso-2022-cn(繁体和简体中文)
  • EUC-JP,班次JIS,ISO-2022-JP(日语)
  • EUC-KR、ISO-2022-KR(朝鲜语)
  • KOI8-R、MacCyrillic、IBM855、IBM866、ISO-8859-5、Windows-1251(西里尔文)
  • ISO-8859-2,Windows-1250(匈牙利语)
  • ISO-8859-5,Windows-1251(保加利亚语)
  • Windows-1252(英语)
  • ISO-8859-7,Windows-1253(希腊语)
  • ISO-8859-8,Windows-1255(可视和逻辑希伯来语)
  • TIS-620(泰语)

需要Python2.6或更高版本

命令行工具

chardet附带了一个命令行脚本,它报告一个 或更多文件:

% charade somefile someotherfile
somefile: windows-1252 with confidence 0.5
someotherfile: ascii with confidence 1.0

关于

这是一个港口的马克朝圣者的优秀查德。前两个版本 需要维护:一个支持Python2.x,另一个支持 python 3.x.在这个端口上做了少量的工作,现在就开始猜字谜 在一个代码库中支持两者。

这项工作的基础是马克最后一个可用的chardet源 Python3000。

原因

一切都有原因吗?不,但在这种情况下,原因是 帮助requests和其他任何痛苦的人 需要这个。

X、Y或Z呢?

如果x、y或z(可能做同样事情的其他项目的口语) 确实存在,确实存在于查拉德之前,我对他们感到失望。 并没有让他们更出名。这会让我省下不少时间。

maintainer:Ian Cordasco

1.0.3–2012年1月17日

  • chardet.py脚本重命名为charade

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java连接在一个屏幕上成功下载,在第二个屏幕上用几乎相同的代码获得错误   java调用super。超级的方法,跳过超级。方法   使用Web服务连接到sharepoint 2013的Java应用程序   java我无法正确呈现editText   httpurlconnection如何在java中检查url连接状态   java Spring Security可以为同一用户接受多个密码吗?   java如何在PreparedStatement中使用自动生成的@Id?   java每个数组表示一个位模式   java我不确定如何记录鼠标在某个区域被点击的次数   spring如何解决:java。lang.NoSuchMethodError:javax。坚持不懈实体管理器。createStoredProcedureQuery(Ljava/lang/String;)   java如何为blackberry中listfield项内的不同字段触发事件   安卓使用Proguard混淆java代码   java在grails 2中与多个数据源有一个和一个域关联。十、   java在尝试在单击按钮时返回combobox值时一直出错   java我可以在setter中使用@Resource注释而不是字段吗?   java Eclipse调试步进不工作   java比较相同对象的两个表并选择不同的表