擅长:python、mysql、java
<p>我认为您在这里面临一个权衡:人类的可读性是以性能和大文件大小为代价的。因此,在Python中可用的所有序列化方法中,JSON不仅可读性最强,而且速度最慢。在</p>
<p>如果我必须追求性能(和文件紧凑性),我会选择<a href="http://docs.python.org/release/2.5.2/lib/module-marshal.html" rel="nofollow noreferrer"><em>marshall</em></a>。您可以使用<em>dump()</em>和<em>load()</em>封送整个数据集,或者根据您的分层思想,将数据集的各个部分封送到单独的文件中。这样,如果您愿意,就为数据处理的并行化打开了大门。在</p>
<p>当然,文档中有各种各样的限制和警告,所以如果您决定安全起见,请使用<a href="http://docs.python.org/release/2.5.2/lib/module-pickle.html" rel="nofollow noreferrer"><em>pickle</em></a>。在</p>