下载pdfurllib.请求写入无法打开的pdf

2024-04-26 03:34:04 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在尝试从一个有身份验证的网站下载一个pdf文件,并保存在本地。此代码似乎在运行,但保存了一个无法打开的pdf文件(“它不是受支持的文件类型,或者因为文件已损坏”)。在

import urllib.request

auth_handler = urllib.request.HTTPBasicAuthHandler()
auth_handler.add_password(realm=None,
                   uri=r'http://website/',
                   user='admin',
                   passwd='pass')
opener =  urllib.request.build_opener(auth_handler)
urllib.request.install_opener(opener)
url = 'http://www.website.com/example.pdf'
res = opener.open(url)
urllib.request.urlretrieve(url, "example.pdf")

Tags: 文件代码auth身份验证httpurlpdf网站
2条回答

我想问题出在“urllib.request.urlretrieve(url示例.pdf")". 完成身份验证后,请改用如下方法保存文件:

pdfFile = urllib.request.urlopen(url)
file = open("example.pdf", 'wb')
file.write(pdfFile.read())
file.close()

听起来你的网址不好。在浏览器中输入该URL时,请确保您的浏览器上有“.pdf”文件。在

编辑:

我想说的是,你的URL应该是这样的:“http://www.cse.msu.edu/~chooseun/Test2.pdf”你的代码必须能够从web地址提取这个pdf。希望这有帮助。在

相关问题 更多 >