在Jython中，如何从UTF-8字节序列创建Unicode字符串？

0 投票

1 回答

1459 浏览

提问于 2025-04-18 11:01

一个日本的Unicode字符'あ'在UTF-8编码下是由三个字节组成的，表示为E38182。现在我在Jython的一个列表里有这个字节序列，像这样：

>>> [0xE3, 0x81, 0x82]
[227, 129, 130]

我能把这个UTF-8字节序列的列表转换成Jython的Unicode字符串吗？我想通过打印这个Unicode字符串来输出'あ'，像下面这样：

str = convert_utf8_list_to_unicode([0xE3, 0x81, 0x82])
print str # => あ

环境信息

unicode 字符编码 java utf-8 jython 字符串转换 mac os x 字节序列

试试这个：

a = [0xE3, 0x81, 0x82]
print "".join([chr(c) for c in a]).decode('UTF-8')

在普通的Python中，这对我来说是有效的。我不知道在Jython中是否会有所不同。

回答于 2025-04-18 由 Python大师

分享举报