"for line in...结果导致UnicodeDecodeError: 'utf-8'编解码无法完成"

3条回答

网友

1楼 · 编辑于 2024-04-25 15:13:48

您的文件实际上不包含utf-8编码的数据，它包含一些其他编码。找出编码是什么，并在open调用中使用它。

例如，在Windows-1252编码中，0xe9将是字符é。

网友

2楼 · 编辑于 2024-04-25 15:13:48

对我来说，ISO 8859-1也很管用，哈哈哈，如果使用语音识别API

示例：

file = open('../Resources/' + filename, 'r', encoding="ISO-8859-1");

网友

3楼 · 编辑于 2024-04-25 15:13:48

根据Mark Ransom的建议，我找到了解决这个问题的正确编码。编码是“ISO-8859-1”，因此用open('u.item', encoding = "ISO-8859-1")替换open("u.item", encoding="utf-8")将解决此问题。