如何在python中将unicode字符串转换为普通文本

网友

1楼 · 编辑于 2024-05-13 20:26:55

您可以使用unicode-escape编解码器来消除重复的反斜杠，并有效地使用字符串。

假设title是一个str，则在解码回unicode（str）之前，需要先对字符串进行编码。

>>> t = title.encode('utf-8').decode('unicode-escape')
>>> t
'ისრაელი == იერუსალიმი'

如果title是bytes实例，则可以直接解码：

>>> t = title.decode('unicode-escape')
>>> t
'ისრაელი == იერუსალიმი'

网友

2楼 · 编辑于 2024-05-13 20:26:55

给，你走。只需使用decode方法并应用unicode_escape

对于Python 2.x

title = "\\u10d8\\u10e1\\u10e0\\u10d0\\u10d4\\u10da\\u10d8 == \\u10d8\\u10d4\\u10e0\\u10e3\\u10e1\\u10d0\\u10da\\u10d8\\u10db\\u10d8"
utfTitle = title.decode('unicode_escape')
print(utfTitle)

#output :ისრაელი == იერუსალიმი

对于python 3.x

title = "\\u10d8\\u10e1\\u10e0\\u10d0\\u10d4\\u10da\\u10d8 == \\u10d8\\u10d4\\u10e0\\u10e3\\u10e1\\u10d0\\u10da\\u10d8\\u10db\\u10d8"
print(title.encode('ascii').decode('unicode-escape'))

网友

3楼 · 编辑于 2024-05-13 20:26:55

假设unicode是str类型，并使用decode和unicode转义进行转换方法

title="\\u10d8\\u10e1\\u10e0\\u10d0\\u10d4\\u10da\\u10d8 == \\u10d8\\u10d4\\u10e0\\u10e3\\u10e1\\u10d0\\u10da\\u10d8\\u10db\\u10d8"

res1 = title.encode('utf-8')

res2 = res1.decode('unicode-escape')

print(res2)

相关问题更多 >

编程相关推荐

热门问题

热门文章

如何在python中将unicode字符串转换为普通文本

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >