Pickle dumps没有唯一的表示?创建Python字典的唯一序列化

2024-05-15 03:32:34 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在编写一个缓存脚本,它接受某个对象并将其存储为一个文件。对象的初始参数应该用作文件名(因为我希望不同的初始参数有不同的缓存)。你知道吗

我认为序列化是一个双射,所以我的计划是序列化(参数)字典,使用hashlib.sha224().hexdigest()创建一个十六进制,并使用前XX个字符作为文件名。但是,使用pickle.dumps重复序列化字典会产生不同的序列化。。。你知道吗

我要序列化词典:

attr = {'I': 1,
 'LBar': 1,
 'N': 50,
 'ProdMatch': 1,
 'T': 10,
 'alpha': 0.5,
 'b': 0.1,
 'c': 0.1,
 'delta': 0.1,
 'deltaN': 0.02,
 'deltaT': 10.0,
 'logspace': False,
 'nT': 1,
 'period': 'quarterly',
 'rho': 0.03,
 'sigma': 0.5}

ser = pickle.dumps(attr)
print(pickle.loads(ser))

它将输入字典和下面的字符串作为输出。你知道吗

b'\x80\x03}q\x00(X\x01\x00\x00\x00cq\x01G?\xb9\x99\x99\x99\x99\x99\x9aX\x01\x00\x00\x00Nq\x02K2X\x01\x00\x00\x00Tq\x03K\nX\x05\x00\x00\x00deltaq\x04G?\xb9\x99\x99\x99\x99\x99\x9aX\x06\x00\x00\x00deltaNq\x05G?\x94z\xe1G\xae\x14{X\x06\x00\x00\x00deltaTq\x06G@$\x00\x00\x00\x00\x00\x00X\x05\x00\x00\x00alphaq\x07G?\xe0\x00\x00\x00\x00\x00\x00X\x03\x00\x00\x00rhoq\x08G?\x9e\xb8Q\xeb\x85\x1e\xb8X\x04\x00\x00\x00LBarq\tK\x01X\x01\x00\x00\x00bq\nG?\xb9\x99\x99\x99\x99\x99\x9aX\x06\x00\x00\x00periodq\x0bX\t\x00\x00\x00quarterlyq\x0cX\x02\x00\x00\x00nTq\rK\x01X\x01\x00\x00\x00Iq\x0eK\x01X\t\x00\x00\x00ProdMatchq\x0fK\x01X\x05\x00\x00\x00sigmaq\x10G?\xe0\x00\x00\x00\x00\x00\x00X\x08\x00\x00\x00logspaceq\x11\x89u.'

然后重新启动Python解释器并运行相同的脚本:

b'\x80\x03}q\x00(X\x05\x00\x00\x00deltaq\x01G?\xb9\x99\x99\x99\x99\x99\x9aX\x05\x00\x00\x00alphaq\x02G?\xe0\x00\x00\x00\x00\x00\x00X\x04\x00\x00\x00LBarq\x03K\x01X\x01\x00\x00\x00Iq\x04K\x01X\x02\x00\x00\x00nTq\x05K\x01X\x01\x00\x00\x00bq\x06G?\xb9\x99\x99\x99\x99\x99\x9aX\x01\x00\x00\x00Tq\x07K\nX\x03\x00\x00\x00rhoq\x08G?\x9e\xb8Q\xeb\x85\x1e\xb8X\x01\x00\x00\x00cq\tG?\xb9\x99\x99\x99\x99\x99\x9aX\t\x00\x00\x00ProdMatchq\nK\x01X\x06\x00\x00\x00periodq\x0bX\t\x00\x00\x00quarterlyq\x0cX\x06\x00\x00\x00deltaNq\rG?\x94z\xe1G\xae\x14{X\x06\x00\x00\x00deltaTq\x0eG@$\x00\x00\x00\x00\x00\x00X\x05\x00\x00\x00sigmaq\x0fG?\xe0\x00\x00\x00\x00\x00\x00X\x08\x00\x00\x00logspaceq\x10\x89X\x01\x00\x00\x00Nq\x11K2u.'

这些是不同的序列化。Pickle没有被破坏,因为loads()将重新生成初始字典,但我不能将此行为用于我的目的,因为如果它在不同的哈希下搜索,它将找不到存储的文件。我也试过dill.dumps,结果是一样的。你知道吗


Tags: 参数字典序列化picklex00x03x01x05
1条回答
网友
1楼 · 发布于 2024-05-15 03:32:34

Python3.6之前的词典没有特定的、可重复的顺序。实际上,在python3到python3.5中,它们的顺序是随机的。你知道吗

尝试对项目进行排序:

import pickle
ser = pickle.dumps(sorted(attr.items()))
print(dict(pickle.loads(ser)))

相关问题 更多 >

    热门问题