python库制作并获取utf8中unicode编码点。

utf8_codepoint的Python项目详细描述


python library生成并获取utf8中unicode代码点的编码。

编码utf8的规则表

设计utf-8可以在下表中看到 由dave prosser提出,随后由ken thompson修改。

Bit Code PointThe first code pointThe last code pointByte in Squence
7U+0000U+007F1
11U+0080U+07FF2
16U+0800U+FFFF3
21U+10000U+1FFFFF4
26U+200000U+3FFFFFF5
31U+4000000U+7FFFFFFF6

您可以在a link中阅读上表中的更多内容。

安装

pip install utf8_codepoint

记录并贡献

github中的更多文档。

示例

使用此包的简单示例。

快速入门

fromutf8_codepointimportCodePoint# unicode symbol for European currencyeuro_money="U+20AC"# create instance objectcp=CodePoint(euro_money)# get representation integer of the Unicode Code Pointprint(cp.to_int())

结果是:

226 130 172

转换为十六进制表示形式

fromutf8_codepointimportCodePoint...print(cp.to_hex())

结果是:

E2 82 AC

到具有二进制表示的字符串

fromutf8_codepointimportCodePoint...print(cp.to_string())

结果是:

11100010 10000010 10101100

到二进制字符串表示的列表

fromutf8_codepointimportCodePoint...print(cp.to_list())

结果是:

['11100010', '10000010', '10101100']

以优美的风格显示所有数据

fromutf8_codepointimportCodePoint...cp.bprint()

结果是:

{'0x20AC': {'bit_list': ['11100010', '10000010', '10101100'],
    'code_point': 16,
    'hexa_list': ['0xe2', '0x82', '0xac'],
    'initial_bit': '1110',
    'integer_list': [226, 130, 172]}}

获取所有数据

fromutf8_codepointimportCodePoint...print(cp.get_all())

结果是:

{'0x20AC':
        {
                'bit_list': ['11100010', '10000010', '10101100'],
                'integer_list': [226, 130, 172],
                'initial_bit': '1110',
                'hexa_list': ['0xe2', '0x82', '0xac'],
                'code_point': 16
        }
}

如果要将其转换为json格式,可以传递 将真值作为get all方法中的参数:

cp.get_all(True)

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
JavaPax考试:从非标准Maven存储库解析Karaf特性存储库(XML文件)   java Spring启动Bean创建异常   java中将ArrayList转换为数组的方法   Android Studio的java Unity插件。   java在CheckStyle中从方法计数中排除getter和setter   HibernateJava。sql。SQLSyntaxErrorException:表/视图“序列”不存在   与命令行程序Java vs C通信   java WebView膨胀异常   java在O(n)java8流中寻找两个列表的交集   java使用Gradle运行单元测试时,最大堆大小在哪里设置?   ssl加载java应用程序(CXF)内的jks文件   CI:Jenkins Git:Simple Java项目:希望在特定时间在脚本上发送消息   java根据位置更改数字   java按数值排序字符串数组   macos java版本“1.6.0_65”是否与java 6模棱两可?   Cassandra中的java时间戳