如何用Python 3下载网站?

18 投票
2 回答
25232 浏览
提问于 2025-04-16 08:45

就是一个简单的HTTP GET请求,类似于PHP中的file_get_contents,或者说是一个简单的功能,我只需要输入一个网址,它就能把内容获取到一个变量里。

2 个回答

0

看起来你想要获取一个网站的静态版本。这个可以通过一个叫做WGET的工具来实现。这个工具可以用一个命令就把指定网址的文件下载下来。

使用 -r(递归)这个参数时要小心,下面是一个例子:

wget -erobots=off -p -H -k -E -w 1 --random-wait -r -l 1 http://your.site

下载网页的本地可用副本

31

使用 urllib 库:

from urllib.request import urlopen
html = urlopen("http://www.stackoverflow.com/").read().decode('utf-8')
print(html)

撰写回答