urllib2错误403:禁止

2024-03-28 16:36:23 发布

您现在位置:Python中文网/ 问答频道 /正文

我已经发布到这个网站,并收到了非常有用的指导,我返回了另一个问题。在

我在这里哪里出错了,我很肯定这是从不同网站访问信息所需要的。在本例中,CME组。在

   import urllib2

url = "http://www.cmegroup.com/trading/energy/natural-gas/natural-gas.html"
request= urllib2.Request(url)
handle = urllib2.urlopen(request)
content = handle.read()
splitted_page = content.split("<span class=\"cmeSubHeading\">", 1);
splitted_page = splitted_page[1].split("</span>", 1)
print splitted_page[0]

读取错误

^{pr2}$

事先非常感谢。在


Tags: url网站requestpagecontenturllib2naturalsplit
2条回答

如果你要做GET请求,我会给你一个请求python包。你可以在this post中看到它的优点。在

但是,如果您收到一条403消息,可能是您试图访问一些受限数据(Wikipedia link)。在

实际上,问题是它们会阻止所有没有用户代理的用户

import urllib2

request = urllib2.Request("http://www.cmegroup.com/trading/energy/natural-gas/natural-gas.html", None, {'User-Agent': 'Mozilla/5.0'})
content = urllib2.urlopen(request).read()
splitted_page = content.split("<span class=\"cmeSubHeading\">", 1);
splitted_page = splitted_page[1].split("</span>", 1)
print splitted_page[0]

相关问题 更多 >