Python将Unicode从文本文件转换为字符

2024-05-13 20:31:20 发布

您现在位置:Python中文网/ 问答频道 /正文

在纯文本文件中,我有如下行:

  181006\td3a8d0236\tNicol\xc3\xa1s\tPe\xc3\xb1a\tmisc.person@email.com

我想使用Python打开并读取文件,然后以解码的形式打印出每一行:

  181006 d3a8d0236        Nicolás Peña    misc.person@email.com

作为一个文本字符串,这非常简单

import codecs
a = b'181006\t000d3a8d0236\tNicol\xc3\xa1s\tPe\xc3\xb1a\tmisc.person@email.com'
b = codecs.decode(a)
print(b)

然而,尽管我可以尝试,我似乎找不到变量中数据的b''文本语法等价物。有很多关于这方面的帖子,但我在使用open()/read()/write()等时运气不佳。有人能给我一个建议吗


Tags: 文件文本comemail解码person文本文件codecs
1条回答
网友
1楼 · 发布于 2024-05-13 20:31:20

你试过了吗。编码('utf_8'),因为这会给你“'b”

例如:

a = str('181006\td3a8d0236\tNicol\xc3\xa1s\tPe\xc3\xb1a\tmisc.person@email.com')
print(a.encode('utf_8'))
b'181006\td3a8d0236\tNicol\xc3\x83\xc2\xa1s\tPe\xc3\x83\xc2\xb1a\tmisc.person@email.com'

然后你可以应用解码

相关问题 更多 >