在Jython中,如何从UTF-8字节序列创建Unicode字符串?
一个日本的Unicode字符'あ'在UTF-8编码下是由三个字节组成的,表示为E38182。现在我在Jython的一个列表里有这个字节序列,像这样:
>>> [0xE3, 0x81, 0x82]
[227, 129, 130]
我能把这个UTF-8字节序列的列表转换成Jython的Unicode字符串吗?我想通过打印这个Unicode字符串来输出'あ',像下面这样:
str = convert_utf8_list_to_unicode([0xE3, 0x81, 0x82])
print str # => あ
环境信息
- 操作系统:Mac OS X 10.9.3 Mavericks
- Jython版本:2.5.3
- Java版本:1.6.0_65
1 个回答
1
试试这个:
a = [0xE3, 0x81, 0x82]
print "".join([chr(c) for c in a]).decode('UTF-8')
在普通的Python中,这对我来说是有效的。我不知道在Jython中是否会有所不同。