我永远不会知道python2.7的解码和编码系统

2条回答

网友

1楼 · 编辑于 2024-05-16 10:56:39

您的文件是用UTF-8正确编码的，但是您的操作系统（直接）不支持Unicode输出。你知道吗

在python2中指定Unicode字符串文字的正确方法是使用“u”前缀。只有在这种情况下，Unicode字符串才实际存储在那里。你知道吗

顺便说一下，您可以看到Python使用repr函数对变量内容的实际想法：

>>> print a
'\xe4\xbb\x8a\xe6\x97\xa5\xe3\x82\x82\xe3\x81\x97\xe3\x81\xaa\xe3\x81\x84\xe3\x81\xa8\xe3\x81\xad'
>>> print b
u'\u4eca\u65e5\u3082\u3057\u306a\u3044\u3068\u306d'

网友

2楼 · 编辑于 2024-05-16 10:56:39

正如评论所指出的，unicode不像Python的许多其他部分那么容易发现和学习

下面的代码示例将打印“今”

# -*- coding: utf-8 -*-
b = u"今日もしないとね"
print b[:2]

但是-编码行只告诉Python如何解释文件中的那些字节。许多编辑器不会寻找编码行，您需要确保它们实际上也在使用utf-8，以确定如何向您显示这些字节。你知道吗

当Python到达print语句时，它将接受unicode对象b，并使用sys.stdout.encoding对其进行编码。现在，这也更好地匹配您的终端/控制台设置，否则您将得到一些垃圾打印代替。你知道吗

相关问题更多 >

编程相关推荐

热门问题

热门文章

我永远不会知道python2.7的解码和编码系统

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >