UnicodeEncodeError:“charmap”编解码器无法编码-字符映射到<undefined>，打印功能

3条回答

网友

1楼 · 编辑于 2024-06-16 16:55:20

我看到了三种解决方案：

更改输出编码，使其始终输出UTF-8。请参见例如Setting the correct encoding when piping stdout in Python，但我无法使这些示例起作用。
下面的示例代码使输出知道目标字符集。
```
# -*- coding: utf-8 -*-
import sys

print sys.stdout.encoding
print u"Stöcker".encode(sys.stdout.encoding, errors='replace')
print u"Стоескер".encode(sys.stdout.encoding, errors='replace')
```
这个例子用问号正确地替换了我名字中任何不可打印的字符。
如果您创建了一个定制的打印函数，例如myprint，使用该机制正确地编码输出，您可以在任何需要的地方用myprint替换打印，而不必使整个代码看起来很难看。

在软件开始时全局重置输出编码：

页面http://www.macfreek.nl/memory/Encoding_of_Python_stdout很好地总结了如何更改输出编码。特别是“StreamWriter包装Stdout”一节很有意思。实际上，它说要像这样更改I/O编码函数：

在Python 2中：

if sys.stdout.encoding != 'cp850':
  sys.stdout = codecs.getwriter('cp850')(sys.stdout, 'strict')
if sys.stderr.encoding != 'cp850':
  sys.stderr = codecs.getwriter('cp850')(sys.stderr, 'strict')

在Python 3中：

if sys.stdout.encoding != 'cp850':
  sys.stdout = codecs.getwriter('cp850')(sys.stdout.buffer, 'strict')
if sys.stderr.encoding != 'cp850':
  sys.stderr = codecs.getwriter('cp850')(sys.stderr.buffer, 'strict')

如果在CGI输出HTML中使用，则可以用“xmlcharrefreplace”替换“strict”，以获取不可打印字符的HTML编码标记。

请随意修改方法，设置不同的编码。。。。请注意，输出非指定数据仍然不起作用。因此，任何数据、输入、文本都必须能够正确地转换为unicode：

# -*- coding: utf-8 -*-
import sys
import codecs
sys.stdout = codecs.getwriter("iso-8859-1")(sys.stdout, 'xmlcharrefreplace')
print u"Stöcker"                # works
print "Stöcker".decode("utf-8") # works
print "Stöcker"                 # fails

网友

2楼 · 编辑于 2024-06-16 16:55:20

出于调试目的，可以使用print(repr(data))。

要显示文本，请始终打印Unicode。不要在脚本中硬编码环境的字符编码，例如Cp850。要解码HTTP响应，请参见A good way to get the charset/encoding of an HTTP response in Python。

要将Unicode打印到Windows控制台，可以use ^{} package。

网友

3楼 · 编辑于 2024-06-16 16:55:20

基于Dirk Stócker的答案，这里有一个用于Python3打印函数的简洁包装函数。使用它就像使用打印一样。

作为额外的好处，与其他答案相比，这不会将文本打印为bytearray（'b“content“），而是作为普通字符串（'content'），因为最后一个解码步骤。

def uprint(*objects, sep=' ', end='\n', file=sys.stdout):
    enc = file.encoding
    if enc == 'UTF-8':
        print(*objects, sep=sep, end=end, file=file)
    else:
        f = lambda obj: str(obj).encode(enc, errors='backslashreplace').decode(enc)
        print(*map(f, objects), sep=sep, end=end, file=file)

uprint('foo')
uprint(u'Antonín Dvořák')
uprint('foo', 'bar', u'Antonín Dvořák')

相关问题更多 >

编程相关推荐

热门问题

热门文章