维基百科爬虫口音

2024-05-15 04:00:39 发布

您现在位置:Python中文网/ 问答频道 /正文

我试图使用wikipediapython包从wikipedia抓取“Muro de Berlín”,但它不懂重音,返回一个随机页面。我试过:

import wikipedia

print (wikipedia.page("Muro de Berlín").content)

wikipedia.set_lang("es")

print (wikipedia.page(pageid="3722").content)
print (wikipedia.page(pageid="3722", auto_suggest=False).content)

print (wikipedia.page("Berlin Wall").content)
print (wikipedia.page("Berlin Wall", auto_suggest=False).content)

有人知道怎么解决这个问题吗?你知道吗


Tags: falseautopagedecontentwikipediaprintsuggest
1条回答
网友
1楼 · 发布于 2024-05-15 04:00:39

最后我想明白了。它需要用unicode编写,因此应该转换utf8,以便进行查询。你知道吗

variable=unicode("Muro de Berlín", 'unicode-escape')
print (wikipedia.page(variable).content)

相关问题 更多 >

    热门问题