cchardet是一种高速通用字符编码检测器。

cchardet的Python项目详细描述


cchardet

cchardet是一种高速通用字符编码检测器。-绑定到 uchardt

< <<< appveyor构建状态

支持的语言/编码

  • 国际(Unicode)
    • UTF-8
    • UTF-16BE/UTF-16LE
    • UTF-32BE/UTF-32LE/X-ISO-10646-UCS-4-34121/ X-ISO-10646-UCS-4-21431
  • 阿拉伯语
    • ISO-8859-6
    • Windows-1256
  • 保加利亚语
    • ISO-8859-5
    • Windows-1251
  • 中文
    • ISO-2022-中国
    • 大5
    • euc-tw
    • GB18030
    • 赫兹-国标-2312
  • 克罗地亚语:
    • ISO-8859-2
    • ISO-8859-13
    • ISO-8859-16
    • 窗户-1250
    • IBM852
    • Mac-中欧
  • 捷克语
    • 窗户-1250
    • ISO-8859-2
    • IBM852
    • Mac-中欧
  • 英语
    • ISO-8859-1
    • ISO-8859-15
    • Windows-1252
  • 英语
    • ascii
  • 世界语
    • ISO-8859-3
  • 爱沙尼亚语
    • ISO-8859-4
    • ISO-8859-13
    • ISO-8859-13
    • Windows-1252
    • Windows-1257
  • 芬兰语
    • ISO-8859-1
    • ISO-8859-4
    • ISO-8859-9
    • ISO-8859-13
    • ISO-8859-15
    • Windows-1252
  • 法语
    • ISO-8859-1
    • ISO-8859-15
    • Windows-1252
  • 德语
    • ISO-8859-1
    • Windows-1252
  • 希腊语
    • ISO-8859-7
    • Windows-1253
  • 希伯来语
    • ISO-8859-8
    • Windows-1255
  • 匈牙利语:
    • ISO-8859-2
    • 窗户-1250
  • 爱尔兰盖尔语
  • ISO-8859-1
  • ISO-8859-9
  • ISO-8859-15
  • Windows-1252
  • 意大利语
    • ISO-8859-1
    • ISO-8859-3
    • ISO-8859-9
    • ISO-8859-15
    • Windows-1252
  • 日语
    • ISO-2022-日本
    • 班次JIS
    • euc-jp
  • 韩语
    • ISO-2022-韩国
    • euc-kr/uhc
  • 立陶宛语
    • ISO-8859-4
    • ISO-8859-10
    • ISO-8859-13
  • 拉脱维亚语
    • ISO-8859-4
    • ISO-8859-10
    • ISO-8859-13
  • 马耳他语
    • ISO-8859-3
  • 波兰语:
    • ISO-8859-2
    • ISO-8859-13
    • ISO-8859-16
    • 窗户-1250
    • IBM852
    • Mac-中欧
  • 葡萄牙语
    • ISO-8859-1
    • ISO-8859-9
    • ISO-8859-15
    • Windows-1252
  • 罗马尼亚语:
    • ISO-8859-2
    • ISO-8859-16
    • 窗户-1250
    • IBM852
  • 俄语
    • ISO-8859-5
    • KOI8-R
    • Windows-1251
    • mac-西里尔文
    • IBM866
    • IBM855
  • 斯洛伐克语
    • 窗户-1250
    • ISO-8859-2
    • IBM852
    • <中心绳
  • 斯洛文尼亚语
    • ISO-8859-2
    • ISO-8859-16
    • Windows-1250
    • IBM852
    • M > <
  • 示例

    # -*- coding: utf-8 -*-importcchardetaschardetwithopen(r"src/tests/samples/wikipediaJa_One_Thousand_and_One_Nights_SJIS.txt","rb")asf:msg=f.read()result=chardet.detect(msg)print(result)

    基准

    $ cd src/
    $ pip install chardet
    $ python tests/bench.py
    

    结果

    CPU:Intel(R)Core(TM)i5-4690 CPU@3.50GHz

    内存:DDR3 1600MHz 16GB

    平台:ubuntu 16.04 amd64

    巨蟒2.7.13
    <表> < COLGROUP > < COL/> < COL/> <广告> 请求(呼叫) < /广告> <正文> chardet v3.0.2版 0.36 cchardet 2.0.1版 1396.42 < > <表>
    巨蟒3.6.1
    <表> < COLGROUP > < COL/> < COL/> <广告> 请求(呼叫) < /广告> <正文> chardet v3.0.2版 0.35 cchardet 2.0.1版 1467.77 < > <表>

    许可证

    请参见复制文件。

    联系人

    欢迎加入QQ群-->: 979659372 Python中文网_新手群

    推荐PyPI第三方库


    热门话题
    java kikoso/swipeable卡安卓   java致命异常:使用Firebase的令牌刷新器   如何捕获java。网SocketException:java中的管道断裂?   安卓 Flatter找不到捆绑的Java版本   java如何将容器添加到框架中?   java如何通过Jackson传递原始JSON?   java Thymeleaf变量超出范围?   Java泛型返回泛型参数化为更具体的两种类型?   java如何在Eclipse for Development模式下设置MySQL+Tomcat+GWT   Java小程序身份验证   java试图在spring中集成openId,但给出了BeanDefinitionParsingException   Java无法读取文本文件中的其他行   Rally项目使用JAVA API的修订历史记录   java Android改型v2插入失败错误403   spring boot应用程序中的java多个spring数据jpa模块(非spring boot)依赖关系?   java如何在设置登录和cookie后刷新GWTP应用程序?杜松子酒注射剂   java JDBC连接在Windows上非常慢,在Linux上很好