Python中自定义JSON排序键的顺序
有没有办法在Python 2.6中给JSON的sort_keys提供一个自定义的key或者比较函数呢?
我有一个从JSON得到的字典列表,像这样:
[
{
"key": "numberpuzzles1",
"url": "number-puzzle-i.html",
"title": "Number Puzzle I",
"category": "nestedloops",
"points": "60",
"n": "087"
},
{
"key": "gettingindividualdigits",
"url": "getting-individual-digits.html",
"title": "Getting Individual Digits",
"category": "nestedloops",
"points": "80",
"n": "088"
}
]
...我把它存储在一个叫assigndb
的列表里。我想加载这个JSON,修改它,然后用dumps
(或者其他方法)把它重新序列化出来,同时保持键的顺序不变。
到目前为止,我尝试过这样的做法:
ordering = {'key': 0, 'url': 1, 'title': 2, 'category': 3,
'flags': 4, 'points': 5, 'n': 6}
def key_func(k):
return ordering[k]
# renumber assignments sequentially
for (i, a) in enumerate(assigndb):
a["n"] = "%03d" % (i+1)
s = json.dumps(assigndb, indent=2, sort_keys=True, key=key_func)
...但当然,dumps
并不支持像list.sort()
那样的自定义key。也许可以用一个自定义的JSONEncoder
?我好像没能搞定。
5 个回答
2
这是一个既简洁又强大的递归实现,使用了“前置”和“后置”键。你可以在这里查看具体的代码:https://gist.github.com/jeromerg/91f73d5867c5fa04ee7dbc0c5a03d611
def sort_recursive(node, first_keys, last_keys):
""" Sort the dictionary entries in a whole JSON object tree"""
fixed_placements = {
**{key: (0, idx) for idx, key in enumerate(first_keys)},
**{key: (2, idx) for idx, key in enumerate(last_keys)},
}
return _sort_recursive(node, lambda key: fixed_placements.get(key, (1, key)))
def _sort_recursive(node, key_fn):
if isinstance(node, list):
return [_sort_recursive(val, key_fn) for val in node]
elif isinstance(node, dict):
sorted_keys = sorted(node.keys(), key=key_fn)
return {k:_sort_recursive(node[k], key_fn) for k in sorted_keys}
else:
return node
11
一个想法(在2.7版本中测试过):
import json
import collections
json.encoder.c_make_encoder = None
d = collections.OrderedDict([("b", 2), ("a", 1)])
json.dumps(d)
# '{"b": 2, "a": 1}'
可以参考:OrderedDict 和 issue6105。这个 c_make_encoder
的小技巧似乎只在Python 2.x中需要。虽然这不是一个直接的解决办法,因为你需要把 dict
改成 OrderedDict
,但它可能还是有用的。我查看了json库(encode.py),发现里面的顺序是硬编码的:
if _sort_keys:
items = sorted(dct.items(), key=lambda kv: kv[0])
4
这看起来有点复杂,不过如果tokland的解决办法对你不管用的话,可以试试这个:
data = [{'category': 'nestedloops', 'title': 'Number Puzzle I', 'url': 'number-puzzle-i.html', 'n': '087', 'points': '60', 'key': 'numberpuzzles1'}, {'category': 'nestedloops', 'title': 'Getting Individual Digits', 'url': 'getting-individual-digits.html', 'n': '088', 'points': '80', 'key': 'gettingindividualdigits'}]
ordering = {'key': 0, 'url': 1, 'title': 2, 'category': 3,
'flags': 4, 'points': 5, 'n': 6}
outlist = []
for d in data:
outlist.append([])
for k in sorted(d.keys(), key=lambda k: ordering[k]):
outlist[-1].append(json.dumps({k: d[k]}))
for i, l in enumerate(outlist):
outlist[i] = "{" + ",".join((s[1:-1] for s in outlist[i])) + "}"
s = "[" + ",".join(outlist) + "]"