用于与存档信息交互的工具。
aiu的Python项目详细描述
存档IT实用程序
存档it实用程序是一个python库,用于从存档it集合中提取信息。目前,大多数工作都是通过一个类ArchiveItCollection
完成的,该类执行屏幕抓取以获取常规集合元数据、种子列表和种子元数据。
安装
这个包在PyPI上称为aiu
安装通过pip
:
pip install aiu
使用ArchiveItCollection
类
存档It实用程序的核心是一个名为ArchiveItCollection
的类,该类有许多方法可以使用其集合标识符提取有关存档It集合的信息
例如,要使用iPython获取有关存档It集合5728的信息,可以执行以下操作:
In [1]: from aiu import ArchiveItCollection
In [2]: aic = ArchiveItCollection(5728)
In [3]: aic.get_collection_name()
Out[3]: 'Social Media'
In [4]: aic.get_collectedby()
Out[4]: 'Willamette University'
In [5]: aic.get_archived_since()
Out[5]: 'Apr, 2015'
In [6]: aic.is_private()
Out[6]: False
In [7]: seeds = aic.list_seed_uris()
In [8]: len(seeds)
Out[8]: 107
从这次会议我们现在知道这个集合的名字是social media,它是由willamete university收集的,它是从2015年4月开始存档的,它不是私有的,它有107个种子。
现在,请检查aiu/archiveit_collection.py
中的源代码,以获取要与该类一起使用的方法的完整列表