建立公共数据的最优放气字典

2024-04-29 00:48:33 发布

您现在位置:Python中文网/ 问答频道 /正文

我在这个领域里问了这么多问题,但找不到我要找的东西。
我通过窄带网络发送小的二进制文件(~5MB),这应该非常相似,我想用zlib(python)压缩它们。
我想建立一个预定义的词典,但标准的通用词典并不相关,因为它是非文本信息。
此外,手动查找常见的序列也不是一件容易的工作,只能在这种特定类型的文件上工作。在

我正在寻找一个test-n-inspect方法,在这里我可以压缩一个文件,然后查看用于输出的字典(压缩数据)。
然后,通过收集这些字典,我可以运行一些测试来找到最佳的。
问题是(在zlib规范中搜索之后):如何从压缩的二进制数据中提取字典?在

我看到每个压缩数据都是从二进制数据开始,然后是2\x00字节,然后是数据。
所以我相信它就在那里,但我如何提取和利用它呢?(或者我还差一点…)

(用python2.7测试zlib)


Tags: 文件数据文本网络信息类型标准字典