使用raw_input输入希伯来文(python)
我知道这个问题很常见,但我看了一些论坛帖子和文章,还是没找到解决办法,我觉得这应该是个简单的问题。问题是我有一段代码,用户输入了一些希伯来字母(用 raw_input)。只要我打印用户输入的内容就没问题,但一旦把它放进列表里,就变成了可能是 UTF-8 的字节版本(我不太确定)。我似乎无法解码它,我觉得原因是我不知道实际控制台使用的是什么编码。下面的内容只是我用来理解如何处理希伯来字母的练习。我还尝试在列表项前加一个“u”,但没成功,或者我没有用对语法来处理列表。
我使用的是 Python 2.7.8 和 Python IDLE 编辑器。我的操作系统是 Win7 64位。这是代码
#!/usr/bin/python
# -*- coding: utf8 -*-
word=raw_input('בחר מילה')
print word
loc=[]
for i in word:
print i
print type(i)
word=word+i
loc.append(i)
print loc
这是输出结果
בחר מילהשמש
שמש
ש
<type 'str'>
מ
<type 'str'>
ש
<type 'str'>
['\xf9', '\xee', '\xf9']
我该如何把列表项转换成希伯来字母呢?谢谢你的帮助。
1 个回答
0
摘自 这里
可以尝试使用:
import sys
text= raw_input().decode(sys.stdin.encoding)
要确保文本是Unicode格式,通常的规则是尽早将输入转换为Unicode。