soch download cli允许您对瑞典开放文化遗产(k-samsók)记录进行多线程批量下载,以进行离线处理和分析。
soch-download的Python项目详细描述
soch下载cli
soch download cli允许您对瑞典开放文化遗产(k-samsók)记录进行多线程批量下载,以进行脱机处理和分析。
先决条件
- python>;=3.4和pip
安装
pip install soch-download
用法示例
heads up:此程序可能使用所有可用的系统CPU。
基于soch搜索查询(文本、cql、索引等)下载记录:
soch-download --action=query --query=thumbnailExists=j --outdir=path/to/target/directory
从特定机构下载记录:
soch-download --action=institution --institution=raa --outdir=path/to/target/directory
使用预定义的操作/查询下载记录:
soch-download --action=all --outdir=path/to/target/directory soch-download --action=geodata-exists --outdir=path/to/target/directory
解包
默认情况下,下载操作会下载每个包含多达500个rdf的大型xml文件,在下载之后,您可以使用unpack
参数将所有这些文件转换为单独的rdf文件:
soch-download --unpack=path/to/xml/files --outdir=path/to/target/directory
misc
列出所有可用参数和操作:
soch-download --help
使用您自己的soch api密钥:
soch-download --action=query --query=itemKeyWord=hus --outdir=path/to/target/directory --key=your-api-key