如何在Python中检测mojibake(乱码文本)?

2024-06-16 16:53:16 发布

您现在位置:Python中文网/ 问答频道 /正文

如果在python中运行

print 'Äppleß','Äppleß'.decode('latin-1').encode('utf-8')

这是一个mojibake(由于不正确的编码/解码而导致的混乱文本),但是python不会引发错误。在

我希望它在mojibake的例子中抛出一个错误。在

我听说过这样的事情: https://ftfy.readthedocs.io/en/latest/#

还有什么关于捷径的想法或经验吗?在


Tags: https文本编码错误解码事情utf例子