在Python中为大量图像生成唯一哈希键的好策略是什么?

1 投票
3 回答
2262 浏览
提问于 2025-04-17 11:05

我有几百万个文件要上传到亚马逊的S3存储上。我需要为每张图片创建一个独特的标识符。我不想用md5,因为它需要扫描整个文件,这样会比较慢。而且,我们的应用程序允许有重复的图片。有没有什么快速生成几乎可以保证唯一的标识符的建议?最好是32个字符的字母数字组合(可以区分大小写)。谢谢!

3 个回答

-1

我觉得在上传文件的时候,用当前的时间(datetime.now())算出来的MD5值是可以的。

1

在文件上传并保存之后,直接对这个文件使用MD5哈希。

http://docs.python.org/library/md5.html

把哈希值应用到数据库表里,或者根据你存储的方式来处理。

3

我不认为这可以称为哈希,因为哈希通常是指根据文件内容生成一个独特的值。

相反,你可能需要的是UUID

撰写回答