使用Python lxml设置网页解析超时

3 投票
1 回答
992 浏览
提问于 2025-04-15 22:22

我正在使用Python的lxml库来解析HTML页面:

import lxml.html

# this might run indefinitely
page = lxml.html.parse('http://stackoverflow.com/')

有没有办法为解析设置超时时间?

1 个回答

1

看起来它是用 urllib.urlopen 作为打开链接的方式,但最简单的方法就是直接修改默认的超时时间,这样可以让网络连接等得更久。

import socket
timeout = 10
socket.setdefaulttimeout(timeout)

当然,这只是一个简单粗暴的解决办法。

撰写回答