在Jython中,如何从UTF-8字节序列创建Unicode字符串?

0 投票
1 回答
1459 浏览
提问于 2025-04-18 11:01

一个日本的Unicode字符'あ'在UTF-8编码下是由三个字节组成的,表示为E38182。现在我在Jython的一个列表里有这个字节序列,像这样:

>>> [0xE3, 0x81, 0x82]
[227, 129, 130]

我能把这个UTF-8字节序列的列表转换成Jython的Unicode字符串吗?我想通过打印这个Unicode字符串来输出'あ',像下面这样:

str = convert_utf8_list_to_unicode([0xE3, 0x81, 0x82])
print str # => あ

环境信息

  • 操作系统:Mac OS X 10.9.3 Mavericks
  • Jython版本:2.5.3
  • Java版本:1.6.0_65

1 个回答

1

试试这个:

a = [0xE3, 0x81, 0x82]
print "".join([chr(c) for c in a]).decode('UTF-8')

在普通的Python中,这对我来说是有效的。我不知道在Jython中是否会有所不同。

撰写回答