如何在Python中将unicode转换为其原始字符

2024-05-29 11:05:11 发布

您现在位置:Python中文网/ 问答频道 /正文

我首先尝试输入一个Unicode字符,用UTF-8编码,然后解码回来。Python很高兴地返回了原来的角色。 我看了一下编码的字符串,它是b'\xe6\x88\x91'。我不明白这是什么,看起来像3个十六进制数。在

然后我做了一些研究,我发现CJK集从4E00开始,所以现在我希望Python向我展示这个字符的样子。我该怎么做?我需要把4E00转换成类似上面这个的形式吗?在


Tags: 字符串角色编码unicode解码字符形式utf
2条回答

您需要使用UTF-8编码对其进行解码:

>>> print(b'\xe6\x88\x91'.decode('UTF-8'))
我

通过解码,你可以将字节(即b'...')转换成Unicode字符串,这就是如何显示/使用文本的方法。在

文本b'\xe6\x88\x91'是unicode码位\u6211的utf-8编码字节的表示,unicode码位\u6211是字符我。因此,除了转换成带有.decode('utf-8')的unicode字符串外,不需要转换其他内容。在

相关问题 更多 >

    热门问题