我有这个字符串:
"Binh Thanh, H\\u1ed3 Ch\\u00ed Minh, Vietnam"
我不确定它是如何编码的(unicode/utf-8…),但我知道它对应于这个:
"Binh Thanh, Hồ Chí Minh, Vietnam"
我想创建一个函数来正确显示它
用法:
def display_characters(text):
print(text)
# .encode? .decode? utf-8? unicode?
display_characters("Binh Thanh, H\\u1ed3 Ch\\u00ed Minh, Vietnam")
期望值:
"Binh Thanh, Hồ Chí Minh, Vietnam"
问题是
\\
,它创建正常的\
,并且不是unicode的一部分。你知道吗Python有特殊的编码
'raw_unicode_escape'
和'unicode_escape'
,这有助于解决unicode中的一些问题。你知道吗在这个例子中也可以
unicode_escape
文件:Python Specific Encodings
因为字符串包含
\\u
而不是\u
,所以反斜杠被转义,所以这个字符串包含文本反斜杠。如果改为"Binh Thanh, H\u1ed3 Ch\u00ed Minh, Vietnam"
,那么\u
将是一个正确的Unicode转义。你知道吗可以删除斜杠并使用print。我认为多余的斜线干扰了:
相关问题 更多 >
编程相关推荐