我有一个包含以下内容的文本文件:
....
{"emojiCharts":{"emoji_icon":"\u2697","repost": 3, "doc": 3, "engagement": 1184, "reach": 6734, "impression": 44898}}
{"emojiCharts":{"emoji_icon":"\U0001f924","repost": 11, "doc": 11, "engagement": 83, "reach": 1047, "impression": 6981}}
....
有些表情符号是\uhhhh
格式,有些是\Uhhhhhhhh
格式。在
是否有任何方法可以对其进行编码/解码以显示表情符号?因为如果文件只包含\Uhhhhhhhh
,那么一切正常。在
为了达到这个阶段,我用以下方式修改了文件:
^{pr2}$要显示表情符号,我需要使用以下命令:
insightData.decode("raw_unicode_escape").encode('utf-16', 'surrogatepass').decode('utf-16')
但它显示一个错误:
UnicodeEncodeError: 'ascii' codec can't encode character u'\u2600' in position 30: ordinal not in range(128)
解决方案:
with open(OUTPUT, "r") as infileInsight:
insightData = infileInsight.read()\
.decode('raw_unicode_escape')
with open(OUTPUT, "w+") as outfileInsight:
outfileInsight.write(insightData.encode('utf-8'))
好吧。Python2.7,赢10。在
原始文件是纯ASCII格式的,包含精确的unicode转义符(“\u###############################。在
读取文件并使用“unicode escape”进行解码:那么就有了一个Python unicode字符串;我们将其命名为
your_unicode_string
。在要写入文件,请选择:
或者
^{pr2}$然后:
对于给定的python和os版本,在没有任何篡改的情况下,您将无法在控制台上看到emojis。在
你可以这么做。在
输出:
⚗
这与UTF-8或UTF-16无关。一般来说,这只是Python转义Unicode字符的方法,U+FFFF以下的所有字符都使用
\uFFFF
,上面的所有内容都使用\UFFFFFFFF
(出于历史原因)。在这两个转义序列在Python字符串中的工作方式应该完全相同。在我的机器上,使用@vks的解决方案:
与python3类似。在
相关问题 更多 >
编程相关推荐