如何用Python 3下载网站?
就是一个简单的HTTP GET请求,类似于PHP中的file_get_contents,或者说是一个简单的功能,我只需要输入一个网址,它就能把内容获取到一个变量里。
2 个回答
0
看起来你想要获取一个网站的静态版本。这个可以通过一个叫做WGET的工具来实现。这个工具可以用一个命令就把指定网址的文件下载下来。
使用 -r(递归)这个参数时要小心,下面是一个例子:
wget -erobots=off -p -H -k -E -w 1 --random-wait -r -l 1 http://your.site。
31
使用 urllib 库:
from urllib.request import urlopen
html = urlopen("http://www.stackoverflow.com/").read().decode('utf-8')
print(html)