Python编码从ISO到UTF8

3 投票

2 回答

755 浏览

数据工程师

提问于 2025-04-15 22:05

我正在用一个Python脚本（Python 2.5和PyPy）读取我的电子邮件。结果中有些内容不是ASCII格式，所以我得到了这样的字符串：

=?ISO-8859-7?B?0OXm7/Dv8d/hIPP07+0gyuno4enx/u3h?='

有没有办法把它解码并转换成utf-8格式，这样我就可以处理它了？我试过用.decode('ISO-8859-7')，但得到的还是同样的字符串。

utf-8 字符集数据转换字符串解码编码电子邮件处理 iso-8859-7

2 个回答

了解一下 MIME编码和 Base64编码。 base64模块会对你有帮助。

回答于 2025-04-15 由 Python大师

分享举报

import email.header as eh

unicode_data= u''.join(
    str_data.decode(codec or 'ascii')
    for str_data, codec
    in eh.decode_header('=?ISO-8859-7?B?0OXm7/Dv8d/hIPP07+0gyuno4enx/u3h?='))
# unicode_data now is u'Πεζοπορία στον Κιθαιρώνα'

你应该在这里使用unicode_data。不过，如果你（觉得你）需要UTF-8编码的字符串，你可以：

utf8data= unicode_data.encode('utf-8')

更新：我修改了.decode的调用，以处理codec为None的情况（例如eh.decode_header('plain text')）

回答于 2025-04-15 由 Python大师

分享举报

Python编码从ISO到UTF8

2 个回答

撰写回答