如何访问mediawiki中的表格

2024-05-17 14:18:22 发布

您现在位置:Python中文网/ 问答频道 /正文

现在我正在使用mediawikiapi和requests模块尝试从wikipedia页面的某个表中提取某些信息。作为一个例子,我们将使用歌曲僵尸那里有一个'表'在右边,它告诉我专辑,作者,发行日期等。我遇到的唯一问题是我不知道如何查询这个数据,因为我使用这个链接作为端点:https://en.wikipedia.org/w/api.php?format=json&formatversion=2&action=query&titles=Zombie_(song)&prop=extracts 试图搜索我需要的东西,但它会在页面上显示文本。我试过沙盒,在寻找什么能提供我需要的信息时遇到了问题。谢谢你的建议和意见。你知道吗


Tags: 模块数据https信息链接作者页面wikipedia
1条回答
网友
1楼 · 发布于 2024-05-17 14:18:22

对于这种元数据,最好使用Wikidata。在Wikipedia的侧边栏中有一个指向Wikidata项的链接,您可以使用API查询(如https://www.wikidata.org/w/api.php?action=wbgetclaims&entity=Q169298)以结构化的方式获取数据。有关这些结果的含义的信息,请参见Wikibase API docs。你知道吗

[Edit:]要获取实体ID,可以使用带有维基百科标题(titles)和wiki ID(sites)的^{};例如:https://www.wikidata.org/w/api.php?action=wbgetentities&sites=enwiki&titles=Zombie_(song)

相关问题 更多 >