数据转储的最佳压缩算法是什么
我正在为我的网站创建数据转储,方便其他人下载和分析。每个转储将是一个巨大的XML文件。
我想找出最合适的压缩算法,要求是:
- 压缩效率高(对CPU的使用要合理)
- 生成的文件尽可能小
- 比较常见,容易找到
我知道一些压缩的基本知识,但对哪种算法最合适还不太清楚。我会使用MySQL和Python来生成转储,所以需要找一个有好用Python库的算法。
1 个回答
3
一般来说,使用标准的GZIP压缩级别就足够了,适合大多数情况。压缩级别越高,消耗的CPU时间就越多。虽然BZ2的压缩效果更好,但它的速度也比较慢。总的来说,压缩效率和CPU使用之间总是有一个平衡...使用默认的压缩级别进行压缩通常都是可以的。