使用请求进行递归URI调用时发生UnboundLocalError

def fetch_page(self, url): head = {'User-agent': "Mozilla/5.0 (Windows NT 10.0; WOW64; rv:42.0) Gecko/20100101 Firefox/42.0"} time.sleep(2) print "..." try: r = requests.get(url, headers=head) except: time.sleep(2) print 'error', url, "Trying again" traceback.print_exc() self.fetch_page(url) r.raise_for_status() print r.status_code return r.text

... 200 Traceback (most recent call last): File "./calling.py", line 140, in <module> get_valid_url = Get() File "./calling.py", line 22, in __init__ self.call() File "./calling.py", line 44, in call text = self.fetch_page(link.strip('\n')) File "./calling.py", line 35, in fetch_page r.raise_for_status() UnboundLocalError: local variable 'r' referenced before assignment

1条回答

网友

1楼 · 发布于 2024-04-19 07:32:46

假设您第一次运行函数并得到404。输入except块，然后再次递归调用fetch_page。假设你这次得了200分。您不需要输入except块，而是运行到函数的末尾并return r.text。你知道吗

控件然后返回到调用者，这是您之前对fetch_page的调用。执行下一行代码，即r.raise_for_status()。但是在这个调用fetch_page（顶层调用）时，r从未真正定义过，因为在try块中抛出了一个异常。因此，一个UnboundLocalError。你知道吗

一个可能的解决方案-而不是：

except:
    time.sleep(2)
    print 'error', url, "Trying again"
    traceback.print_exc()
    self.fetch_page(url)

将递归调用的结果返回到fetch_page：

except:
    time.sleep(2)
    print 'error', url, "Trying again"
    traceback.print_exc()
    return self.fetch_page(url)

我还建议你做一些更像这样的事情，这样你就不会在不同的缩进水平上得到回报，当你可以避免的时候：

try:
    r = requests.get(url, headers=head)
    r.raise_for_status()
    print r.status_code
    return r.text
except:
    time.sleep(2)
    print 'error', url, "Trying again"
    traceback.print_exc()
    return self.fetch_page(url)

相关问题更多 >

编程相关推荐

热门问题

热门文章