如何使用Python mechanize保存包含页面图像的网页
我明白了,mechanize可以让Python脚本的行为跟浏览器一模一样。用浏览器的话,我可以把加载好的页面保存到本地磁盘上,包括页面里的图片。那我该怎么用mechanize做到这一点呢?它好像不能保存页面上的图片。
我在使用来自这个页面的示例。提前谢谢你!
1 个回答
3
虽然没有直接的方法来做到这一点,但你可以按照以下步骤操作:
- 用 mechanize 或 urllib2 打开网页
- 获取网页的 HTML 内容
- 用 lxml 解析 HTML
- 找到所有的图片链接
- 对每个图片链接,用 mechanize 或 urllib2 打开并保存图片
在这种情况下,如果你只想处理一个页面,而且不需要登录,那么 mechanize 并没有比 urllib2 更好的地方。你可能会发现 requests 这个库对这个任务很有帮助。