将中文ascii字符串转换为中文字符串

2024-04-24 23:27:21 发布

您现在位置:Python中文网/ 问答频道 /正文

我试图使用sys模块设置默认编码来转换字符串,但它不起作用。在

字符串是:

`\xd2\xe6\xc3\xf1\xba\xcb\xd0\xc4\xd4\xf6\xb3\xa4\xbb\xec\xba\xcf`

在中文里是益民核心增长混合的意思。但是我怎样才能把它转换成中文字符串呢?在

我试过了:

^{pr2}$

所以,我被这种情况弄糊涂了,为什么我可以打印string.decode("gbk"),但python控制台中的new_str只返回另一个编码类型?在

我的操作系统是windows10,Python版本是python2.7。非常感谢你!在


Tags: 模块字符串编码sysxc4xcbxe6xc3
1条回答
网友
1楼 · 发布于 2024-04-24 23:27:21

你做得对。在

在本例中,new_str实际上是一个由u前缀表示的unicode字符串。在

>>> new_str
u'\u76ca\u6c11\u6838\u5fc3\u589e\u957f\u6df7\u5408' # It returns the another encode type.

当您解码GBK编码的字符串时,您将得到一个unicode字符串。这个字符串的每个字符都是一个unicode码位,例如

^{pr2}$

这就是Python在解释器中显示unicode字符串的方式-它使用repr来显示它。但是当您打印字符串时,Python将转换为您的终端(sys.stdout.encoding)的编码,这就是为什么字符串会如您所期望的那样显示的原因。在

所以,这不是字符串的不同编码,只是Python在解释器中显示字符串的方式。在

相关问题 更多 >