urllib2 下载的zip文件损坏
我正在尝试用以下代码从measuredhs.com下载zip文件:
url ='https://dhsprogram.com/customcf/legacy/data/download_dataset.cfm?Filename=BFBR62DT.ZIP&Tp=1&Ctry_Code=BF'
request = urllib2.urlopen(url)
output = open("install.zip", "w")
output.write(request.read())
output.close()
但是下载的文件打不开。我收到一条消息,说压缩的zip文件无效。
要访问下载链接,需要先登录,我已经登录了。如果我点击链接,它会自动下载文件,或者即使我把链接粘贴到浏览器里也是一样。
谢谢
1 个回答
3
试着以二进制模式写入本地文件。
with open('install.zip', 'wb') as output:
output.write(request.read())
另外,比较下载文件的md5或sha1哈希值,可以帮助你判断下载的文件是否被损坏。