我如何用Python请求一个认证过的网址
我想用urllib2访问一个需要登录的页面。我希望能找到一个直接的方法,比如这样:
urllib2.urlopen('http://username:pwd@server/page')
如果没有,那我该怎么进行身份验证呢?
2 个回答
1
据我所知,这个事情没有简单的方法。基本上,你发出一个请求,服务器会回复你一个401的错误,意思是需要授权,这个错误会被urllib2转化成一个异常。
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
File "C:\Python25\lib\urllib2.py", line 124, in urlopen
return _opener.open(url, data)
File "C:\Python25\lib\urllib2.py", line 387, in open
response = meth(req, response)
File "C:\Python25\lib\urllib2.py", line 498, in http_response
'http', request, response, code, msg, hdrs)
File "C:\Python25\lib\urllib2.py", line 425, in error
return self._call_chain(*args)
File "C:\Python25\lib\urllib2.py", line 360, in _call_chain
result = func(*args)
File "C:\Python25\lib\urllib2.py", line 506, in http_error_default
raise HTTPError(req.get_full_url(), code, msg, hdrs, fp)
urllib2.HTTPError: HTTP Error 401: Authorization Required
你需要捕捉这个异常,然后创建一个urllib2.HTTPPasswordManager对象,把用户名和密码添加到这个HTTPPasswordManager里。接着,你要创建一个urllib2.HTTPBasicAuthHandler对象,再创建一个opener对象,最后用这个opener去获取网址。相关的代码和教程可以在这里找到:http://www.voidspace.org.uk/python/articles/urllib2.shtml#id5