Python将latin1转换为UTF8

2024-04-29 09:04:08 发布

您现在位置:Python中文网/ 问答频道 /正文

在Python2.7中,如何将latin1字符串转换为UTF-8。

例如,我正试图转换成utf-8。

>>> "é"
'\xe9'
>>> u"é"
u'\xe9'
>>> u"é".encode('utf-8')
'\xc3\xa9'
>>> print u"é".encode('utf-8')
é

字母isé,是带锐音符的拉丁文小写字母E(U+00E9) 的UTF-8字节编码为:c3a9
拉丁字节编码是:e9

如何获得拉丁字符串的UTF-8编码版本?有人能举个例子来说明如何转换é吗?


Tags: 字符串编码字节is字母utfencode音符
1条回答
网友
1楼 · 发布于 2024-04-29 09:04:08
>>> u"é".encode('utf-8')
'\xc3\xa9'

你有一个UTF-8编码的字节序列。不要试图直接打印编码字节。要打印它们,您需要将编码的字节解码回Unicode字符串。

>>> u"é".encode('utf-8').decode('utf-8')
u'\xe9'
>>> print u"é".encode('utf-8').decode('utf-8')
é

注意,编码和解码是相反的操作,有效地抵消了。最后返回原始的u"é"字符串,尽管Python将其打印为等效的u'\xe9'

>>> u"é" == u'\xe9'
True

相关问题 更多 >