2024-05-29 11:05:11 发布
网友
我首先尝试输入一个Unicode字符,用UTF-8编码,然后解码回来。Python很高兴地返回了原来的角色。 我看了一下编码的字符串,它是b'\xe6\x88\x91'。我不明白这是什么,看起来像3个十六进制数。在
b'\xe6\x88\x91'
然后我做了一些研究,我发现CJK集从4E00开始,所以现在我希望Python向我展示这个字符的样子。我该怎么做?我需要把4E00转换成类似上面这个的形式吗?在
您需要使用UTF-8编码对其进行解码:
>>> print(b'\xe6\x88\x91'.decode('UTF-8')) 我
通过解码,你可以将字节(即b'...')转换成Unicode字符串,这就是如何显示/使用文本的方法。在
b'...'
文本b'\xe6\x88\x91'是unicode码位\u6211的utf-8编码字节的表示,unicode码位\u6211是字符我。因此,除了转换成带有.decode('utf-8')的unicode字符串外,不需要转换其他内容。在
\u6211
.decode('utf-8')
您需要使用UTF-8编码对其进行解码:
通过解码,你可以将字节(即
b'...'
)转换成Unicode字符串,这就是如何显示/使用文本的方法。在文本
b'\xe6\x88\x91'
是unicode码位\u6211
的utf-8编码字节的表示,unicode码位\u6211
是字符我。因此,除了转换成带有.decode('utf-8')
的unicode字符串外,不需要转换其他内容。在相关问题 更多 >
编程相关推荐