我有一些复杂的结构需要转换成JSON。通常情况下,这是好的,但有时,我会得到这样的坏数据:
{'FIRST_NAME': 'sdffg\xed', 'LAST_NAME': 'sdfsadf', 'MORE_INFO':['hi','blah', {'key1': 'value1'}]}
简单的json.dumps(data)
给了我:
UnicodeDecodeError: 'ascii' codec can't decode byte 0xed in position 6: ordinal not in range(128)
就像json.dumps(data, ensure_ascii=False)
。你知道吗
在utf-8中无法读取数据的情况下,我只希望它被忽略。我能找到的唯一方法就是:
item.decode("utf8", "ignore") if item else None
结构中的每一项。那么,有没有:
json.dumps()
内实现这一点(首选)?你知道吗
如果您的所有附加字符都是
latin-1
,就像您的示例中使用的:会给你正确的输出
要删除非ascii字符,可以使用:
相关问题 更多 >
编程相关推荐