如何用python获取wikipedia对话页的内容

2024-06-16 13:32:07 发布

您现在位置:Python中文网/ 问答频道 /正文

我目前正在使用以下代码获取维基百科的页面内容。你知道吗

import pywikibot as pw

page = pw.Page(pw.Site('en'), 'Forensic science')
page.text

但是,上面的代码似乎没有重新返回wikipedia的Talk pages中的内容。e、 g

import pywikibot as pw
page = pw.Page(pw.Site('en'), 'Talk:Forensics science')
page.text

更准确地说,我想得到这个页面的内容:https://en.wikipedia.org/w/index.php?title=Talk:Forensic_science&action=edit

如果需要,我很乐意提供更多细节。:)


Tags: 代码textimport内容aspagesite页面
1条回答
网友
1楼 · 发布于 2024-06-16 13:32:07

你的谈话页面标题有误。'Talk:Forensics science'应该是'Talk:Forensic science'(在Forensic结尾没有s)。除此之外,它应该像你期望的那样工作。你知道吗

如果要在页面不存在时获得显式错误,请尝试Page.get方法:

import pywikibot as pw
page = pw.Page(pw.Site('en', 'wikipedia'), 'Talk:Forensics science')
text = page.get()

这将提高:

[...]
"...site.py", line 4166, in loadrevisions
    raise NoPage(page)
pywikibot.exceptions.NoPage: Page [[wikipedia:en:Talk:Forensics science]] doesn't exist.
CRITICAL: Exiting due to uncaught exception <class 'pywikibot.exceptions.NoPage'>

相关问题 更多 >