以编程方式从internet exp保存HTML

2024-04-26 18:55:27 发布

您现在位置:Python中文网/ 问答频道 /正文

有没有一种编程方式(最好是Python)来保存Windows下internetexplorer网页上的HTML源代码?我用Python的urllib2.urlopen尝试了这个方法,但得到了404错误。但我可以打开链接与internet explorer没有404。我想我可以用python的Webbrowser模块打开IE中的链接,但是Webbrowser没有办法从IE保存HTML


Tags: 方法网页源代码链接windowshtml编程错误
2条回答

这是可行的,但我不知道是什么网站,如果有认证需要它,这就是为什么。你没有给出网站的详细信息,也没有在你的问题中尝试过什么。以下是如何从网页保存html的示例:

import urllib

url = 'http://www.google.com'
lines = urllib.urlopen(url).readlines()

html = open('google.html', 'w')
for line in lines:
    html.write(line)
import urllib
from lxml import html

url = "http://yourWebsite.com/index.html"
page = html.fromstring(urllib.urlopen(url).read())

你试过这个吗?在

相关问题 更多 >