现在我正在使用mediawikiapi和requests模块尝试从wikipedia页面的某个表中提取某些信息。作为一个例子,我们将使用歌曲僵尸那里有一个'表'在右边,它告诉我专辑,作者,发行日期等。我遇到的唯一问题是我不知道如何查询这个数据,因为我使用这个链接作为端点:https://en.wikipedia.org/w/api.php?format=json&formatversion=2&action=query&titles=Zombie_(song)&prop=extracts 试图搜索我需要的东西,但它会在页面上显示文本。我试过沙盒,在寻找什么能提供我需要的信息时遇到了问题。谢谢你的建议和意见。你知道吗
对于这种元数据,最好使用Wikidata。在Wikipedia的侧边栏中有一个指向Wikidata项的链接,您可以使用API查询(如https://www.wikidata.org/w/api.php?action=wbgetclaims&entity=Q169298)以结构化的方式获取数据。有关这些结果的含义的信息,请参见Wikibase API docs。你知道吗
[Edit:]要获取实体ID,可以使用带有维基百科标题(} ;例如:https://www.wikidata.org/w/api.php?action=wbgetentities&sites=enwiki&titles=Zombie_(song)
titles
)和wiki ID(sites
)的^{相关问题 更多 >
编程相关推荐