无论如何重写urllib2.HTTPError或urllib.error.HTTPError并读取响应HTML

2024-04-29 04:08:21 发布

您现在位置:Python中文网/ 问答频道 /正文

我收到一个“HTTP Error 500:Internal Server Error”响应,但我仍然想读取错误HTML中的数据。

对于Python2.6,我通常使用以下方法获取页面:

import urllib2
url = "http://google.com"
data = urllib2.urlopen(url)
data = data.read()

当尝试在失败的URL上使用这个时,我得到异常urllib2.HTTPError

urllib2.HTTPError: HTTP Error 500: Internal Server Error

在返回内部服务器错误时,如何获取此类错误页(有或没有urllib2)?

注意,对于Python 3,相应的异常是urllib.error.HTTPError


Tags: 数据方法importhttpurldataserverhtml
3条回答

如果你是说你想读500人的身体:

request = urllib2.Request(url, data, headers)
try:
        resp = urllib2.urlopen(request)
        print resp.read()
except urllib2.HTTPError, error:
        print "ERROR: ", error.read()

在您的情况下,您不需要建立请求。就这么做

try:
        resp = urllib2.urlopen(url)
        print resp.read()
except urllib2.HTTPError, error:
        print "ERROR: ", error.read()

所以,不重写urllib2.HTTPError,只处理异常。

alist=['http://someurl.com']

def testUrl():
    errList=[]
    for URL in alist:
        try:
            urllib2.urlopen(URL)
        except urllib2.URLError, err:
            (err.reason != 200)
            errList.append(URL+" "+str(err.reason))
            return URL+" "+str(err.reason)
    return "".join(errList)

testUrl()

这个HTTPErroris a file-like object。你可以捕捉它,然后read它的内容。

try:
    resp = urllib2.urlopen(url)
    contents = resp.read()
except urllib2.HTTPError, error:
    contents = error.read()

相关问题 更多 >