2024-04-26 18:55:27 发布
网友
有没有一种编程方式(最好是Python)来保存Windows下internetexplorer网页上的HTML源代码?我用Python的urllib2.urlopen尝试了这个方法,但得到了404错误。但我可以打开链接与internet explorer没有404。我想我可以用python的Webbrowser模块打开IE中的链接,但是Webbrowser没有办法从IE保存HTML
这是可行的,但我不知道是什么网站,如果有认证需要它,这就是为什么。你没有给出网站的详细信息,也没有在你的问题中尝试过什么。以下是如何从网页保存html的示例:
import urllib url = 'http://www.google.com' lines = urllib.urlopen(url).readlines() html = open('google.html', 'w') for line in lines: html.write(line)
import urllib from lxml import html url = "http://yourWebsite.com/index.html" page = html.fromstring(urllib.urlopen(url).read())
你试过这个吗?在
这是可行的,但我不知道是什么网站,如果有认证需要它,这就是为什么。你没有给出网站的详细信息,也没有在你的问题中尝试过什么。以下是如何从网页保存html的示例:
你试过这个吗?在
相关问题 更多 >
编程相关推荐