使用mediawiki的api,检索属于给定类别的页面
mw-category-members的Python项目详细描述
mw类别成员
使用mediawiki的api:检索属于给定类别的页面
安装
pip install mw_category_members
用法
importcategory_membersresults=category_members.retrieve('Category:Presidents_of_the_United_States')forrinresults:print(r['name'],r['link'])
参数
defretrieve(cat_name,mw_instance='https://en.wikipedia.org',types=['page','subcat','file'],clean_subcat_names=False):
- 类别名称:类别名称,例如“类别:美国总统”。
- mw_instance:要使用哪个mediawiki实例(url“origin”)。默认为“https://en.wikipedia.org”。
- 类型:要检索的页面类型。默认为
['page', 'subcat', 'file']
。 - 清除子类别名称:如果
True
,则删除标题的例如“category:”前缀。默认为False
。
返回
页面数组,其中一个页面是{'name': 'some name', 'link': 'some absolute link'}
的字典。
许可证
麻省理工学院。