按原样下载网页(python 3.x.x)

2024-04-26 23:14:10 发布

您现在位置:Python中文网/ 问答频道 /正文

我试着从文本文件中获取一些链接,然后直接下载到我的电脑上。不过,我希望这些下载的网页是完全一样的,因为它是在浏览器。我下载的这些wiki页面不一样,它们不显示一些图片,当我打开它们时,大部分都是文本。你知道吗

我怎么能达到我想要的,看到了一些东西与刮和美丽的汤然而我不是经验

我的代码:

import urllib.request

links=[]
fr=open('wiki_linkovi','r')
fw1=open('imena_elemenata.txt', 'w')
link=fr.readlines()
j=0

for i in link:
    base='https://en.wikipedia.org/wiki/'
    start=i.find(base)+len(base)
    end=i.find('\n',start)
    ime=i[start:end]
    fw1.write(ime+'\n')

    response = urllib.request.urlopen(i) #save starts here-----
    webContent = response.read()
    f = open(ime+'.html', 'wb')

    f.write(webContent)
    f.close

    j=j+1
    print(str(j)+'. link\n')

所以是的,简而言之,我想完全下载网页


Tags: 网页baseresponserequestwikilinkopenfr