彼得·派珀用管道传输了一个Python程序，丢失了他所有的unicode字符

网友

1楼 · 编辑于 2024-04-24 16:18:14

从您的评论和问题更新来看，数据似乎正确编码为UTF-8。这意味着您只需要告诉您的浏览器它是UTF-8，或者使用BOM，或者通过向HTML文档中添加编码信息来更好：

<head>
  <meta http-equiv="Content-Type" content="text/html; charset=utf-8">
</head>

如果文档不是有效的XML，就不应该使用XML声明。在

最好和最可靠的方法是通过HTTP为文件提供服务，并适当地设置Content-Type:头。在

网友

2楼 · 编辑于 2024-04-24 16:18:14

大多数Windows下的程序都会假定您使用的是默认的Windows编码，对于英语安装，它将是ISO-8859-1。这也适用于命令窗口输出。不幸的是，没有办法将默认编码设置为UTF-8—有一个为它定义的代码页，但是它没有得到很好的支持。在

有些编辑器会在文件的开头识别任何BOM字符并切换到UTF-8，但这不能保证。在

如果您要生成HTML，您应该包含正确的charset标记；然后浏览器将正确解释它。在

网友

3楼 · 编辑于 2024-04-24 16:18:14

When you pipe a Python program to an output file on Windows, does it always use this character set?

用于输出到管道的默认编码。在我的机器上：

In [5]: sys.getdefaultencoding()
Out[5]: 'ascii'

If not, is there a workaround?

^{pr2}$

现在所有输出都被编码为“utf-8”。在

我认为处理这种情况的正确方法

redo a whole bunch of logic

将来自internet源的所有数据从服务器或页面编码解码为unicode，然后使用上面显示的解决方法将默认编码设置为utf-8。在