Python:无法读取ASCII编码的文件

>>> f = open('bugreport.txt') >>> f.read() Traceback (most recent call last): File "<stdin>", line 1, in <module> File "/usr/lib/python3.6/codecs.py", line 321, in decode (result, consumed) = self._buffer_decode(data, self.errors, final) UnicodeDecodeError: 'utf-8' codec can't decode byte 0xc0 in position 12788794: invalid start byte >>> f = open('bugreport.txt', encoding='ascii') >>> f.read() Traceback (most recent call last): File "<stdin>", line 1, in <module> File "/usr/lib/python3.6/encodings/ascii.py", line 26, in decode return codecs.ascii_decode(input, self.errors)[0] UnicodeDecodeError: 'ascii' codec can't decode byte 0xef in position 5455694: ordinal not in range(128)

2条回答

网友

1楼 · 编辑于 2024-04-24 13:14:03

文件很可能被编码为拉丁语-1或utf-16（little-endian）。在

>>> bytes_ = [b'\xc0', b'\xef']
>>> for b in bytes_:
...     print(repr(b), b.decode('latin-1'))
... 
b'\xc0' À
b'\xef' ï
>>> bytes_ = [b'\xc0\x00', b'\xef\x00']
>>> for b in bytes_:
...     print(repr(b), b.decode('utf-16le'))
... 
b'\xc0\x00' À
b'\xef\x00' ï

网友

2楼 · 编辑于 2024-04-24 13:14:03

在Python3中，您可以使用开放上下文指定编码。在

with open(file, encoding='utf-8') as f:
    data = f.read()

相关问题更多 >

编程相关推荐

热门问题

热门文章