以编程方式保存Internet Explorer中的HTML

-2 投票
2 回答
553 浏览
提问于 2025-04-18 15:11

有没有一种编程的方法(最好是用Python)可以在Windows上保存Internet Explorer网页的HTML源代码?我试过用Python的urllib2.urlopen,但出现了404错误。不过我可以在Internet Explorer中打开这个链接,没有404错误。我觉得我可以用Python的Webbrowser模块在IE中打开这个链接,但Webbrowser模块没有办法从IE保存HTML。

2 个回答

0

这个方法可以用,但我不知道你说的网站是什么,也不知道是否需要登录才能访问,所以我不能确定。你在提问时没有提供关于这个网站和你尝试过的内容的详细信息。下面是一个示例,展示了如何从网页上保存HTML内容:

import urllib

url = 'http://www.google.com'
lines = urllib.urlopen(url).readlines()

html = open('google.html', 'w')
for line in lines:
    html.write(line)
0
import urllib
from lxml import html

url = "http://yourWebsite.com/index.html"
page = html.fromstring(urllib.urlopen(url).read())

你试过这个吗?

撰写回答