如何JSON序列化集合？

File "/usr/lib/python2.7/json/encoder.py", line 201, in encode chunks = self.iterencode(o, _one_shot=True) File "/usr/lib/python2.7/json/encoder.py", line 264, in iterencode return _iterencode(o, 0) File "/usr/lib/python2.7/json/encoder.py", line 178, in default raise TypeError(repr(o) + " is not JSON serializable") TypeError: set([]) is not JSON serializable

3条回答

网友

1楼 · 编辑于 2024-05-23 14:25:55

我将Raymond Hettinger's solution改编为python 3。

以下是改变的地方：

unicode消失
用super()更新了对父级default的调用
使用base64将bytes类型序列化为str（因为python 3中的bytes似乎无法转换为JSON）

from decimal import Decimal
from base64 import b64encode, b64decode
from json import dumps, loads, JSONEncoder
import pickle

class PythonObjectEncoder(JSONEncoder):
    def default(self, obj):
        if isinstance(obj, (list, dict, str, int, float, bool, type(None))):
            return super().default(obj)
        return {'_python_object': b64encode(pickle.dumps(obj)).decode('utf-8')}

def as_python_object(dct):
    if '_python_object' in dct:
        return pickle.loads(b64decode(dct['_python_object'].encode('utf-8')))
    return dct

data = [1,2,3, set(['knights', 'who', 'say', 'ni']), {'key':'value'}, Decimal('3.14')]
j = dumps(data, cls=PythonObjectEncoder)
print(loads(j, object_hook=as_python_object))
# prints: [1, 2, 3, {'knights', 'who', 'say', 'ni'}, {'key': 'value'}, Decimal('3.14')]

网友

2楼 · 编辑于 2024-05-23 14:25:55

JSON表示法只有少数本机数据类型（对象、数组、字符串、数字、布尔值和空值），因此任何在JSON中序列化的数据都需要表示为这些类型之一。

如json module docs所示，这种转换可以由JSONEncoder和JSONDecoder自动完成，但随后您将放弃一些可能需要的其他结构（如果将集合转换为列表，则将失去恢复常规列表的能力；如果使用dict.fromkeys(s)将集合转换为字典，则将失去恢复字典的能力）。

一个更复杂的解决方案是构建一个可以与其他本地JSON类型共存的自定义类型。这允许您存储嵌套结构，其中包括列表、集合、dict、小数、datetime对象等：

from json import dumps, loads, JSONEncoder, JSONDecoder
import pickle

class PythonObjectEncoder(JSONEncoder):
    def default(self, obj):
        if isinstance(obj, (list, dict, str, unicode, int, float, bool, type(None))):
            return JSONEncoder.default(self, obj)
        return {'_python_object': pickle.dumps(obj)}

def as_python_object(dct):
    if '_python_object' in dct:
        return pickle.loads(str(dct['_python_object']))
    return dct

下面是一个示例会话，显示它可以处理列表、dict和set：

>>> data = [1,2,3, set(['knights', 'who', 'say', 'ni']), {'key':'value'}, Decimal('3.14')]

>>> j = dumps(data, cls=PythonObjectEncoder)

>>> loads(j, object_hook=as_python_object)
[1, 2, 3, set(['knights', 'say', 'who', 'ni']), {u'key': u'value'}, Decimal('3.14')]

或者，可以使用更通用的序列化技术，例如YAML、Twisted Jelly，或者Python的pickle module。它们都支持更大范围的数据类型。

网友

3楼 · 编辑于 2024-05-23 14:25:55

您可以创建一个自定义编码器，它在遇到set时返回list。下面是一个例子：

>>> import json
>>> class SetEncoder(json.JSONEncoder):
...    def default(self, obj):
...       if isinstance(obj, set):
...          return list(obj)
...       return json.JSONEncoder.default(self, obj)
... 
>>> json.dumps(set([1,2,3,4,5]), cls=SetEncoder)
'[1, 2, 3, 4, 5]'

你也可以用这种方法检测其他类型。如果需要保留列表实际上是一个集合，则可以使用自定义编码。像return {'type':'set', 'list':list(obj)}这样的东西可能有用。

要演示嵌套类型，请考虑序列化：

>>> class Something(object):
...    pass
>>> json.dumps(set([1,2,3,4,5,Something()]), cls=SetEncoder)

这将引发以下错误：

TypeError: <__main__.Something object at 0x1691c50> is not JSON serializable

这表示编码器将获取返回的list结果，并对其子级递归调用序列化程序。要为多个类型添加自定义序列化程序，可以执行以下操作：

>>> class SetEncoder(json.JSONEncoder):
...    def default(self, obj):
...       if isinstance(obj, set):
...          return list(obj)
...       if isinstance(obj, Something):
...          return 'CustomSomethingRepresentation'
...       return json.JSONEncoder.default(self, obj)
... 
>>> json.dumps(set([1,2,3,4,5,Something()]), cls=SetEncoder)
'[1, 2, 3, 4, 5, "CustomSomethingRepresentation"]'

相关问题更多 >

编程相关推荐

热门问题

热门文章