要求: 具有2-3层嵌套的Python对象,包含基本数据类型,如整数、字符串、列表和dict。 (没有日期等),需要作为json存储在redis中的一个键上。 对于将json压缩为低内存占用的字符串,有哪些最佳方法可用。 目标物体不是很大,平均有1000个小元素, 或者转换为JSON时大约15000个字符。
例如
>>> my_dict
{'details': {'1': {'age': 13, 'name': 'dhruv'}, '2': {'age': 15, 'name': 'Matt'}}, 'members': ['1', '2']}
>>> json.dumps(my_dict)
'{"details": {"1": {"age": 13, "name": "dhruv"}, "2": {"age": 15, "name": "Matt"}}, "members": ["1", "2"]}'
### SOME BASIC COMPACTION ###
>>> json.dumps(my_dict, separators=(',',':'))
'{"details":{"1":{"age":13,"name":"dhruv"},"2":{"age":15,"name":"Matt"}},"members":["1","2"]}'
1/有没有其他更好的方法来压缩json以节省redis中的内存(同时确保随后的轻量解码)。
2/候选人的msgpack有多好[http://msgpack.org/]?
3/我也应该考虑泡菜之类的选择吗?
我们只是用
gzip
作为压缩器。在我们的用例中,我们将结果存储为文件,如您所想象的。要仅使用内存中的字符串,还可以使用
cStringIO.StringIO()
对象作为文件的替换。如果你想快点,try lz4。 如果你想压缩得更好,go for lzma。
Msgpack速度相对较快,内存占用较小。但是ujson对我来说通常更快。 您应该在数据上比较它们,测量压缩和解压缩速率以及压缩比。
考虑pickle(cPickle在partucular中)和marshal。他们很快。但请记住,它们不是安全的或可扩展的,您需要为速度付出额外的责任。
基于@Alfe的answer,这里有一个版本,它将内容保存在内存中(用于网络I/O任务)。我还做了一些更改来支持Python 3。
要测试压缩,请尝试:
相关问题 更多 >
编程相关推荐