用Unicode（UTF8）表示非英语字符

网友

1楼 · 编辑于 2024-05-16 01:49:35

从您的显示中，很难确定字符串中是什么。假设是显示的24个字符，我相信下面的最后一行回答了您的问题。在

s = "Skr\\u00E4ddarev\\u00E4gen"
print(len(s))
for c in s: print(c, end=' ')
print()
print(eval("'"+s+"'"))
print(eval("'"+s+"'").encode('utf-8'))

这个指纹

^{pr2}$

网友

2楼 · 编辑于 2024-05-16 01:49:35

在Python 3中，可能会发生以下情况：

如果你从HTML文件中提取字符串，你必须读入使用正确编码的HTML文件。在
如果您有python3代码中的字符串，那么它在内存中应该已经是Unicode（32位）。在

将字符串写入一个文件，您必须在打开的文件中指定所需的编码。在

网友

3楼 · 编辑于 2024-05-16 01:49:35

如果您使用的是python3，而这正是字符串的内容，那么它“只起作用”：

>>> s = "Skr\u00E4ddarev\u00E4gen"
>>> s
'Skräddarevägen'

如果你把这个字符串作为原始数据，你必须对它进行解码。如果是Unicode字符串，则必须先将其编码为字节。最终结果将是Unicode。如果已经编码了一个字节，则跳过一步。在

^{pr2}$

如果你需要正确解码的话，你会看到：

>>> s = "Skr\u00E4ddarev\u00E4gen"
>>> s
'Skr\\u00E4ddarev\\u00E4gen'
>>> s.decode('unicode_escape')
u'Skr\xe4ddarev\xe4gen'
>>> print s.decode('unicode_escape')
Skräddarevägen

相关问题更多 >

编程相关推荐

热门问题

热门文章

用Unicode（UTF8）表示非英语字符

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >