我有Python Requests函数错误编码的文件,扩展了特殊字符

2024-05-16 20:10:41 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一大组文件被Python请求r.text转换破坏了。最初是UTF-8,但请求假定为ISO-8859-1,因此,例如,e acute已从hexC3A9扩展到C383C2A9。有很多这样的。有没有办法用Python解决这个问题?
顺便说一句,我现在知道如何在写入文件之前设置编码 r.encoding = r.apparent_encoding 但是现在有没有办法不追踪每一个翻译就解决这个问题呢

我猜,如果我读ISO-8859-1,我会有两个新字符,不会转换回一个ETF-8字符,对吗


Tags: 文件text编码iso字符utfencoding我会