用urllib保存网页
import urllib
url='www.something.com/something..'
f = urllib.urlretrieve(url,'copy.html')
这段代码只会创建一个HTML文件,这个文件里面有一个直接链接到指定的URL(也就是说,离线的时候是无法访问的)。那么,怎么才能把网页存储起来,让它在离线时也能使用呢?
1 个回答
2
你需要获取页面指向的所有其他资源,比如CSS文件、图片等等。
我建议你使用“wget”,它已经可以满足你的需求了。