如何将U+XXX转换为实际的Unicode字符(原生脚本)
我有一串代码点(U+XXXX),需要把它们转换成真正的字符。这些代码点是UTF-8格式的。我查了很多关于unicode的资料,但还是不知道该怎么做。
我可以把U+XXXX去掉,只留下数字(XXXX),但是接下来该怎么做呢?有人建议使用“unichr()”,但在Python3中根本不认这个。
抱歉如果这个问题很基础;我刚开始学习Python编程。
2 个回答
0
在Python 3中,unichr()被chr()替代了。你可以像这样把类似'U+XXXX'的字符串转换成字符:
chr(int('U+XXXX'.lstrip('U+'), 16))
1
Python 3.x 没有 unichr()
这个函数,因为 Python 3.x 自带支持 Unicode 字符串。
3>> chr(int('3042', 16))
'あ'