我有一大组文件被Python请求r.text转换破坏了。最初是UTF-8,但请求假定为ISO-8859-1,因此,例如,e acute已从hexC3A9
扩展到C383C2A9
。有很多这样的。有没有办法用Python解决这个问题?
顺便说一句,我现在知道如何在写入文件之前设置编码
r.encoding = r.apparent_encoding
但是现在有没有办法不追踪每一个翻译就解决这个问题呢
我猜,如果我读ISO-8859-1,我会有两个新字符,不会转换回一个ETF-8字符,对吗
Tags:
目前没有回答
相关问题 更多 >
编程相关推荐