我希望能够将表情符号解码为对应的代码点,如图here。我仅限于使用2.7中的标准库
例如:
🇲🇩 -&燃气轮机U+1F1F2
U+1F1E9
我已经用这个代码获得了第一个代码点,但是我不知道如何提取第二个。有些表情符号甚至有更多的代码点
to_decode = u'🇲🇩'
code = ord(to_decode[0])
if 0xd800 <= code <= 0xdbff:
code = (code - 0xd800) * 1024 + (ord(to_decode[1]) - 0xdc00) + + 0x010000
print(hex(code))
{a1}和{a2}的组合可以满足您的需求
这是一种黑客行为,但您可以使用unicode字符串的
repr
:因此:
及
必须扩展此方法以支持具有两个以上代码点的emojis。您可以考虑使用上面的组合与{{CD2}}。
对于这个问题,实际上需要
list()
,它将Unicode字符分解为其组成代码点作为一个例子,我创建了一个孟加拉字母表的unicode可视化
相关问题 更多 >
编程相关推荐