python 2和3通用编码检测器

chardet的Python项目详细描述


chardet:通用字符编码检测器

Build statushttps://img.shields.io/coveralls/chardet/chardet/stable.svgLatest version on PyPILicense
检测
  • ascii、utf-8、utf-16(2种变体)、utf-32(4种变体)
  • big5、gb2312、euc-tw、hz-gb-2312、iso-2022-cn(繁体和简体中文)
  • EUC-JP,班次JIS,CP932,ISO-2022-JP(日语)
  • EUC-KR、ISO-2022-KR(朝鲜语)
  • KOI8-R、MacCyrillic、IBM855、IBM866、ISO-8859-5、Windows-1251(西里尔文)
  • ISO-8859-5,Windows-1251(保加利亚语)
  • ISO-8859-1,Windows-1252(西欧语言)
  • ISO-8859-7,Windows-1253(希腊语)
  • ISO-8859-8,Windows-1255(可视和逻辑希伯来语)
  • TIS-620(泰语)

注意

我们的ISO-8859-2和Windows-1250(匈牙利)探测器暂时 在我们可以重新训练模型之前禁用。

需要Python2.6、2.7或3.3+。

安装

PyPI安装:

pip install chardet

文档

对于用户,文档现在可以在https://chardet.readthedocs.io/上获得。

命令行工具

chardet附带了一个命令行脚本,它报告一个 或更多文件:

% chardetect somefile someotherfile
somefile: windows-1252 with confidence 0.5
someotherfile: ascii with confidence 1.0

关于

这是马克·朝圣者的经典之作的延续。以前,两个 需要维护的版本:一个支持Python2.x,另一个支持 支持Python3.x。我们最近与Ian Cordascocharade叉子,现在我们有一个 适用于Python2.6+的一致版本。

maintainer:Dan Blanchard

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java如何避免springbootstarterparent和dependency中的flyway包冲突   java文本文件写入不起作用   java获取名为DAO类的Bean创建异常   java类路径和清单文件   如何使用Java中的模式来获取像C中的“sscanf”这样的组?   java Spring自动连接具有构造函数的类   clientSecurity运行的java geode示例失败   java JavaFX:在FXML中从ResourceBundle访问非string对象   java登录到google firebase   java对象在通过构造函数后不会更改。为什么?   java(Android)对特定页面的操作webView   javascript如何在webview的js中从java调用变量   持久化—一种在Java中存储和检索对象而不使用关系数据库的简单方法?   java Ldap获取通讯组列表中的用户   java检查温度条件   java后退按钮警报框(Android Studio)   数组java列表问题:为什么我运行它时,它会在第三次打印时打印出4?   java相对路径与绝对路径