我如何用Python请求一个认证过的网址

0 投票
2 回答
1389 浏览
提问于 2025-04-15 15:00

我想用urllib2访问一个需要登录的页面。我希望能找到一个直接的方法,比如这样:

urllib2.urlopen('http://username:pwd@server/page')

如果没有,那我该怎么进行身份验证呢?

2 个回答

1

据我所知,这个事情没有简单的方法。基本上,你发出一个请求,服务器会回复你一个401的错误,意思是需要授权,这个错误会被urllib2转化成一个异常。

  Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
  File "C:\Python25\lib\urllib2.py", line 124, in urlopen
    return _opener.open(url, data)
  File "C:\Python25\lib\urllib2.py", line 387, in open
    response = meth(req, response)
  File "C:\Python25\lib\urllib2.py", line 498, in http_response
    'http', request, response, code, msg, hdrs)
  File "C:\Python25\lib\urllib2.py", line 425, in error
    return self._call_chain(*args)
  File "C:\Python25\lib\urllib2.py", line 360, in _call_chain
    result = func(*args)
  File "C:\Python25\lib\urllib2.py", line 506, in http_error_default
    raise HTTPError(req.get_full_url(), code, msg, hdrs, fp)
  urllib2.HTTPError: HTTP Error 401: Authorization Required 

你需要捕捉这个异常,然后创建一个urllib2.HTTPPasswordManager对象,把用户名和密码添加到这个HTTPPasswordManager里。接着,你要创建一个urllib2.HTTPBasicAuthHandler对象,再创建一个opener对象,最后用这个opener去获取网址。相关的代码和教程可以在这里找到:http://www.voidspace.org.uk/python/articles/urllib2.shtml#id5

2

这要看你使用的认证方式是什么。

  • 一个简单的例子是 Http认证
  • 如果网站使用 cookies 来进行认证,你需要添加一个 cookiejar,然后通过 http 登录
  • 还有很多其他的认证方式,所以你得搞清楚你需要哪种。

撰写回答