如何将U+XXX转换为实际的Unicode字符(原生脚本)

0 投票
2 回答
1183 浏览
提问于 2025-04-17 22:46

我有一串代码点(U+XXXX),需要把它们转换成真正的字符。这些代码点是UTF-8格式的。我查了很多关于unicode的资料,但还是不知道该怎么做。

我可以把U+XXXX去掉,只留下数字(XXXX),但是接下来该怎么做呢?有人建议使用“unichr()”,但在Python3中根本不认这个。

抱歉如果这个问题很基础;我刚开始学习Python编程。

2 个回答

0

在Python 3中,unichr()被chr()替代了。你可以像这样把类似'U+XXXX'的字符串转换成字符:

chr(int('U+XXXX'.lstrip('U+'), 16))
1

Python 3.x 没有 unichr() 这个函数,因为 Python 3.x 自带支持 Unicode 字符串。

3>> chr(int('3042', 16))
'あ'

撰写回答