当元数据记录满足LTN要求时,从OAI请求中检查和获取元数据记录的简单实用程序
dltn-checker的Python项目详细描述
关于
测试OAI-PMH进料的记录是否符合DLTN的最低要求,并可选择仅收获货物 从请求到磁盘的记录,以便将它们添加到repox并包含在dpla中。
安装
从cli运行内置参数解析
如果你想这样做,你需要克隆这个。还建议使用pipenv来构建这个。
$ git clone https://github.com/DigitalLibraryofTennessee/check_and_harvest $cd check_and_harvest $ pipenv install $ pipenv shell
使用dltnchecker模块中的oaichecker
如果你很酷:太阳镜:
$ pipenv install dltn_checker
否则:
$ pip install dltn_checker
内置参数分析器的示例
- 检查整个OAI-PMH馈送中是否存在坏的DC记录。
$ python run -e http://my-oai-endpoint:8080/OAIHandler -m oai_dc
- 从整个OAI-PMH饲料中检查并获取良好的DC记录。
$ python run -e http://my-oai-endpoint:8080/OAIHandler -m oai_dc -H True
- 检查并从指定的集合中获取良好的XOAI记录。
$ python run -e http://my-oai-endpoint:8080/OAIHandler -m xoai -s my_awesome_xoai_set -H True
- 在repox中检查并从整个提供者获取良好的mods记录。
$ python run -e http://my-oai-endpoint:8080/OAIHandler -m MODS -p CrossroadstoFreedomr0 -H True
使用dltnchecker中的oaichecker类的示例
检查集合中是否有任何错误的文件。
fromdltnchecker.harvestimportOAICheckerrequest=OAIChecker("https://dpla.lib.utk.edu/repox/OAIHandler","crossroads_sanitation","MODS")request.list_records()print(request.bad_records)
默认情况下,这将尝试将好的文件下载到名为output的目录。如果你不想下载,你 需要传递一个名为harvest的附加参数并设置为false。
fromdltnchecker.harvestimportOAICheckerrequest=OAIChecker("https://dpla.lib.utk.edu/repox/OAIHandler","crossroads_sanitation","MODS",harvest=False)request.list_records()print(request.bad_records)