ScanSort帮助整理和重命名书本扫描图像
scansort的Python项目详细描述
scansort帮助整理和重命名书本扫描图像
安装
pip install scansort
概要
scansort [-h] [-v] -odd ODD -even EVEN [-missing MISSING] [-action {move,copy}] [-o OUTPUT] workdir
下降
使用书本边缘扫描仪(如Plustek OpticBook)时, 把书的两面分开扫描是很方便的。 这样你就不需要旋转书本来扫描下一页。 正常从不同侧面扫描图像 进入不同的目录。
scansort帮助整理这些目录 并根据实际页码重命名图像。
该实用程序假定:
- 图片集涵盖 单调递增的页码范围 (可能有已知的缺失数字)。 这意味着前面,身体和(可能)后面的物质 必须单独扫描和处理。
- 偶数页和奇数页放在不同的目录中。
另外,请参见缩进工作流的example。
选项
workdir参数定义工作目录 与所有其他目录名和路径的解释相对应。 默认情况下使用当前目录。
所有页码必须与 书中实际的“物理”页码。
- -odd,-even目录名/路径
- 带有奇数页和偶数页扫描图像的源目录。
- -missingnum[,num]*
- 源目录中缺少以逗号分隔的页码列表 (扫描时意外跳过或根本不存在)。
- -action{移动,复制}
- 是否保留或删除原始图像 从源目录。默认为copy。
- -o目录名/路径
- 重命名扫描图像的输出目录。默认为out 如果不存在,将自动创建。< /dD>
- -h,--help
- 显示帮助消息并退出.< /dD>
- -v,--version
- 显示版本信息并退出.< /dD>
示例
扫描完一本书后,我通常会留下这样的东西:
$ tree ./book ./book ├── lside │ ├── scan0001.tiff │ ├── scan0002.tiff │ ... └── rside ├── scan0001.tiff ├── scan0002.tiff ... 2 directories, 198 files
其中rside包含偶数页。如果我略过 然后意识到我漏掉了两页:2页和10页。
然后我运行scansort整理目录:
$ scansort -odd lside -even rside -missing 2,6 ./book
该实用程序打开一个编辑器以查看结果:
# Please review the correspondence between files and book pages './book/lside/scan0001.tiff': 1 './book/lside/scan0002.tiff': 3 './book/rside/scan0001.tiff': 4 './book/lside/scan0003.tiff': 5 './book/lside/scan0004.tiff': 7 './book/rside/scan0002.tiff': 8 ...
我可以马上编辑页码 或删除所有行以取消操作 (例如,如果发现有更多的页面丢失)。 然后保存并关闭编辑器,页面将被整理:
$ tree ./book/out ./book/out ├── scan0001.tif ├── scan0003.tif ├── scan0004.tif ├── scan0005.tif ├── scan0007.tif ... └── scan0200.tif 0 directories, 198 files
请注意,缺少的页码被省略了。我可以分别扫描 然后放好。