utf-8加问号问题

3 投票
2 回答
2158 浏览
提问于 2025-04-16 14:04

我有一个网站,它通过使用utf-8将用户输入解码为unicode来显示内容。但是,用户输入可能包含二进制数据,而这些数据显然并不总是能被utf-8“解码”。

我在使用Python时,遇到了一个错误,错误信息是:

'utf8' 编码无法解码位置0的字节0xbf:意外的代码字节。你传入的是 '\xbf\xcd...'

有没有一种标准且高效的方法,可以把那些无法解码的字符转换成问号?

如果答案能用Python来说明,那就太好了。

2 个回答

1

我觉得你想要的应该是:

str.decode('utf8','ignore')

这样做应该是丢弃无效的字节,而不是抛出错误

6

试试这个:

inputstring.decode("utf8", "replace")

想了解更多,可以查看这里的内容

撰写回答