Python中自定义JSON排序键的顺序

15 投票
5 回答
13206 浏览
提问于 2025-04-16 08:18

有没有办法在Python 2.6中给JSON的sort_keys提供一个自定义的key或者比较函数呢?

我有一个从JSON得到的字典列表,像这样:

[
  {
    "key": "numberpuzzles1",
    "url": "number-puzzle-i.html",
    "title": "Number Puzzle I",
    "category": "nestedloops",
    "points": "60",
    "n": "087"
  },
  {
     "key": "gettingindividualdigits",
     "url": "getting-individual-digits.html",
     "title": "Getting Individual Digits",
     "category": "nestedloops",
     "points": "80",
     "n": "088"
  }
]

...我把它存储在一个叫assigndb的列表里。我想加载这个JSON,修改它,然后用dumps(或者其他方法)把它重新序列化出来,同时保持键的顺序不变

到目前为止,我尝试过这样的做法:

ordering = {'key': 0, 'url': 1, 'title': 2, 'category': 3,
             'flags': 4, 'points': 5, 'n': 6}

def key_func(k):
    return ordering[k]

# renumber assignments sequentially
for (i, a) in enumerate(assigndb):
    a["n"] = "%03d" % (i+1)

s = json.dumps(assigndb, indent=2, sort_keys=True, key=key_func)

...但当然,dumps并不支持像list.sort()那样的自定义key。也许可以用一个自定义的JSONEncoder?我好像没能搞定。

5 个回答

2

这是一个既简洁又强大的递归实现,使用了“前置”和“后置”键。你可以在这里查看具体的代码:https://gist.github.com/jeromerg/91f73d5867c5fa04ee7dbc0c5a03d611

def sort_recursive(node, first_keys, last_keys):
    """ Sort the dictionary entries in a whole JSON object tree"""
    fixed_placements = {
        **{key: (0, idx) for idx, key in enumerate(first_keys)},
        **{key: (2, idx) for idx, key in enumerate(last_keys)},
    }
    return _sort_recursive(node, lambda key: fixed_placements.get(key, (1, key)))


def _sort_recursive(node, key_fn):
    if isinstance(node, list):
        return [_sort_recursive(val, key_fn) for val in node]
    elif isinstance(node, dict):
        sorted_keys = sorted(node.keys(), key=key_fn)
        return {k:_sort_recursive(node[k], key_fn) for k in sorted_keys}
    else:
        return node
11

一个想法(在2.7版本中测试过):

import json
import collections
json.encoder.c_make_encoder = None
d = collections.OrderedDict([("b", 2), ("a", 1)])
json.dumps(d)
# '{"b": 2, "a": 1}'

可以参考:OrderedDictissue6105。这个 c_make_encoder 的小技巧似乎只在Python 2.x中需要。虽然这不是一个直接的解决办法,因为你需要把 dict 改成 OrderedDict,但它可能还是有用的。我查看了json库(encode.py),发现里面的顺序是硬编码的:

if _sort_keys:
    items = sorted(dct.items(), key=lambda kv: kv[0])
4

这看起来有点复杂,不过如果tokland的解决办法对你不管用的话,可以试试这个:

data = [{'category': 'nestedloops', 'title': 'Number Puzzle I', 'url': 'number-puzzle-i.html', 'n': '087', 'points': '60', 'key': 'numberpuzzles1'}, {'category': 'nestedloops', 'title': 'Getting Individual Digits', 'url': 'getting-individual-digits.html', 'n': '088', 'points': '80', 'key': 'gettingindividualdigits'}]
ordering = {'key': 0, 'url': 1, 'title': 2, 'category': 3,
            'flags': 4, 'points': 5, 'n': 6}
outlist = []
for d in data:
    outlist.append([])
    for k in sorted(d.keys(), key=lambda k: ordering[k]):
        outlist[-1].append(json.dumps({k: d[k]}))

for i, l in enumerate(outlist):
    outlist[i] = "{" + ",".join((s[1:-1] for s in outlist[i])) + "}"

s = "[" + ",".join(outlist) + "]"

撰写回答