我正在工作o scrapy,我抓取了一些站点,并将页面中的项目存储到json文件中,但其中一些包含以下格式。在
l = ["Holding it Together",
"Fowler RV Trip",
"S\u00e9n\u00e9gal - Mali - Niger","H\u00eatres et \u00e9tang",
"Coll\u00e8ge marsan","N\u00b0one",
"Lines through the days 1 (Arabic) \u0633\u0637\u0648\u0631 \u0639\u0628\u0631 \u0627\u0644\u0623\u064a\u0627\u0645 1",
"\u00cdndia, Tail\u00e2ndia & Cingapura"]
我可以预期列表由不同的格式组成,但是我想转换它,并将字符串以其原始名称存储在列表中,如下所示
^{pr2}$提前谢谢。。。。。。。。。。。在
当您序列化为JSON时,可能有一个标志允许您关闭非ASCII字符到
\u
序列的转义。如果您使用的是标准库json
模块,它是ensure_ascii
:但是,请注意,去掉安全措施后,您现在必须能够正确地处理非ASCII字符,否则您将得到一堆
^{pr2}$UnicodeError
s。例如,如果您正在将JSON写入文件,则必须将Unicode字符串显式编码为所需的字符集(例如UTF-8)。在您有包含unicode转义符的字节字符串。您可以使用
unicode_escape
编解码器将它们转换为unicode:你可以把它编码回字节串:
^{pr2}$您可以过滤和解码非unicode字符串,如:
相关问题 更多 >
编程相关推荐