以编程方式保存Internet Explorer中的HTML
有没有一种编程的方法(最好是用Python)可以在Windows上保存Internet Explorer网页的HTML源代码?我试过用Python的urllib2.urlopen,但出现了404错误。不过我可以在Internet Explorer中打开这个链接,没有404错误。我觉得我可以用Python的Webbrowser模块在IE中打开这个链接,但Webbrowser模块没有办法从IE保存HTML。
2 个回答
0
这个方法可以用,但我不知道你说的网站是什么,也不知道是否需要登录才能访问,所以我不能确定。你在提问时没有提供关于这个网站和你尝试过的内容的详细信息。下面是一个示例,展示了如何从网页上保存HTML内容:
import urllib
url = 'http://www.google.com'
lines = urllib.urlopen(url).readlines()
html = open('google.html', 'w')
for line in lines:
html.write(line)
0
import urllib
from lxml import html
url = "http://yourWebsite.com/index.html"
page = html.fromstring(urllib.urlopen(url).read())
你试过这个吗?