字符串处理错误：unicodedecoderror:“utf8”编码解码器无法解码

Traceback (most recent call last): File "shakecount.py", line 3, in <module> words = re.findall('\w+', open('rockyou.txt').read().lower().ASCII) File "/Library/Frameworks/Python.framework/Versions/3.2/lib/python3.2/codecs.py", line 300, in decode (result, consumed) = self._buffer_decode(data, self.errors, final) UnicodeDecodeError: 'utf8' codec can't decode byte 0xf1 in position 5079963: invalid continuation byte

1条回答

网友

1楼 · 发布于 2024-05-13 11:59:08

你的代码与你的错误不完全匹配（我假设你试着调试？），但您的文本文件不是UTF-8。

您需要手动指定编码，我的最佳猜测是latin-1：

words = re.findall('\w+', open('rockyou.txt', encoding='latin-1').read().lower())

如果您想在出现错误的情况下继续，可以将errors='ignore'或errors='replace'传递给open。

编程相关推荐

关于JSP转发的java问题
强制Oracle驱动程序向java输出带有时区的时间戳。sql。使用getObject时的时间戳
Java中的配置单元UDF在创建表时失败
eclipse怀疑Java上下文加载器使用不再存在的文件
范围如何为我没有在JavaEE中编写的类定义单例对象？
java Eclipse未启动：JVM已终止。退出代码=14
仅存在于子类中的属性的java别名（Hibernate标准）
Java字符串插入错误
无法打开java@PropertySource，因为它不存在
java从多项目Maven配置生成WAR文件

相关问题更多 >

编程相关推荐

热门问题

热门文章