从维基百科arti中提取统计信息

2024-04-16 08:57:24 发布

您现在位置:Python中文网/ 问答频道 /正文

我目前正在使用SPARQLWrapper for python从DBpedia文章中提取数据,但我似乎找不到如何提取给定文章的观察者数量(以及其他统计信息)。在

有没有一个简单的方法来实现这一点?我不介意是通过DBpedia,还是直接通过wikipedia(例如使用wget)。在

谢谢你的建议。在


Tags: 数据方法信息for数量文章wgetwikipedia
1条回答
网友
1楼 · 发布于 2024-04-16 08:57:24

禁止获取每一篇任意文章的观察者数量,因为如果每个人都能找到不匹配的页面,这被认为是安全漏洞。例如,只有特权用户才有权访问Special:Unwatched Pages。有一个toolserver tool(它可以访问数据库)显示观察者的数量,但是它仅限于有30个以上的观察者的页面for the same reasons-至少未经验证。在

MediaWiki query API只公开大多数content and status information关于文章,尽管您也可以查询和计算public logs或{a7}来获取(公共)用户操作的统计数据。关于Wikimedia站点的更多统计信息,您可以看看Meta:Statistics,其中列出了各种数据源(主要是http://stats.wikimedia.org/)及其可视化。在

相关问题 更多 >