用解码的阿拉伯字符编写新的jsonL文件

2024-05-23 21:29:01 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在传输阿拉伯语tweet,这些tweet存储为“.jsonl”文件。在Xcode、方括号或textEdit中打开文件时,阿拉伯字符显示为“\u0645\u0635\u0631:\u0625\u0646\u0647\u0627\u0621\u0628\u0639\u0636\u0627\u0644”。但为了分析内容,我需要正确阅读文件,显示实际的阿拉伯语文本。我已经设法在Python(3)控制台中打印它们,但是我仍然需要在一个单独的文件中。我觉得这是一个很简单的事情,但当使用io.打开我总是遇到麻烦。感谢任何想法!在

这是我在python控制台中打印它们的代码:

import json
outFile = open('user_timeline_almanarnews.jsonl', 'r').read()
splitFile = outFile.split('\n')

for eachLine in splitFile:
    x = eachLine.encode('utf-8')
    print(x.decode('unicode-escape'))

Tags: 文件字符outfiletweetxcodejsonl方括号textedit