以编程方式保存Internet Explorer中的HTML

-2 投票

2 回答

553 浏览

提问于 2025-04-18 15:11

有没有一种编程的方法（最好是用Python）可以在Windows上保存Internet Explorer网页的HTML源代码？我试过用Python的urllib2.urlopen，但出现了404错误。不过我可以在Internet Explorer中打开这个链接，没有404错误。我觉得我可以用Python的Webbrowser模块在IE中打开这个链接，但Webbrowser模块没有办法从IE保存HTML。

编程方法网页抓取 404错误 internet explorer webbrowser模块 HTML源代码

2 个回答

这个方法可以用，但我不知道你说的网站是什么，也不知道是否需要登录才能访问，所以我不能确定。你在提问时没有提供关于这个网站和你尝试过的内容的详细信息。下面是一个示例，展示了如何从网页上保存HTML内容：

import urllib

url = 'http://www.google.com'
lines = urllib.urlopen(url).readlines()

html = open('google.html', 'w')
for line in lines:
    html.write(line)

回答于 2025-04-18 由 Python大师

分享举报

import urllib
from lxml import html

url = "http://yourWebsite.com/index.html"
page = html.fromstring(urllib.urlopen(url).read())

你试过这个吗？

回答于 2025-04-18 由 Python大师

分享举报

以编程方式保存Internet Explorer中的HTML

2 个回答

撰写回答