我正在合并两个具有不同目录结构的大型(1000)照片集,其中许多照片已经存在于这两个集中。我要写一个剧本这样:
For a given photo in set B,
Check if a binary match for it exists in set A.
If there's a match, delete the file.
在检查完集合B中的所有文件之后,我将把集合B中的剩余部分(现在是唯一的)合并到集合A中
可能存在具有不同文件名的二进制匹配,因此测试时应忽略文件名。你知道吗
另外,我将对集合B中的每个文件执行集合A搜索,所以我更喜欢一个工具,作为初始扫描的一部分来构建集合A的索引。幸运的是,这个索引可以做一次,而且永远不需要更新。你知道吗
我本来打算使用osxshell脚本,但是python也可以。你知道吗
根据马克的建议,我通过编写一对Python脚本来解决我的问题。你知道吗
md5型索引.py地址:
以及唯一合并.py地址:
假设我想将folderA合并到folderB中,我会: python md5索引.py福尔德拉 #创建索引_输出.txt所有来自福尔德拉的信息
相关问题 更多 >
编程相关推荐