解析维基媒体API
我需要你的帮助。我正在解析维基百科的文章,并使用维基媒体的API。我想读取{{ }}
之间的文本。这里是我的维基媒体API查询。我试过了,但没有找到任何结果。有没有人可以帮我一下?非常感谢。
def getCategory(title):
paramsd = {'action': 'query', 'prop': 'revisions', 'rvprop': 'content', 'format': 'xmlfm', 'rvsection': 0,'titles':title}
params = urllib.urlencode(paramsd)
req = urllib2.Request(url='http://en.wikipedia.org/w/api.php', data=params)
f = urllib2.urlopen(req)
2 个回答
0
你的代码里有个错误。
'format': 'xmlfm'
应该改成这样
'format': 'xml'
这样的话,你就能得到XML格式的数据了。
4
你知道吗,其实已经有一些现成的库可以用来做这个事情。在Python里有个叫pywikipedia的库,其他编程语言也有类似的库。你可以在这个网址找到一个列表:http://www.mediawiki.org/wiki/API:Client_code#API_Access_Libraries,里面列出了四个Python的库。我建议你用这些现成的库,而不是自己从头开始写。