用Python解码和编码希伯来语字符串

2024-06-16 10:27:19 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在尝试对希伯来语字符串“שלום”进行编码和解码。但是,在编码之后,我会胡言乱语:

>>> word = "שלום"
>>> word = word.decode('UTF-8')
>>> word
u'\u05e9\u05dc\u05d5\u05dd'
>>> print word
שלום
>>> word = word.encode('UTF-8')
>>> word
'\xd7\xa9\xd7\x9c\xd7\x95\xd7\x9d'
>>> print word
׳©׳׳•׳

我该怎么做才好?

谢谢。


Tags: 字符串编码解码utfwordencodeprintdecode
1条回答
网友
1楼 · 发布于 2024-06-16 10:27:19

您必须确保您的环境中有正确的编码(shell或脚本)。 如果使用脚本,请包括以下内容:

#!/usr/bin/env python
# -*- coding: utf-8 -*-

以确保您的环境知道您正在使用UTF-8。 您可能会发现您的shell终端只接受ASCII,因此请确保它能够支持UTF-8。

>>> word = "שלום"
>>> word
'\xd7\xa9\xd7\x9c\xd7\x95\xd7\x9d'
>>> print word
שלום
>>> word = word.decode('UTF-8')
>>> word
u'\u05e9\u05dc\u05d5\u05dd'
>>> print word
שלום
>>> word = word.encode('UTF-8')
>>> word
'\xd7\xa9\xd7\x9c\xd7\x95\xd7\x9d'
>>> print word
שלום
>>>

相关问题 更多 >