我正在尝试从一个有身份验证的网站下载一个pdf文件,并保存在本地。此代码似乎在运行,但保存了一个无法打开的pdf文件(“它不是受支持的文件类型,或者因为文件已损坏”)。在
import urllib.request
auth_handler = urllib.request.HTTPBasicAuthHandler()
auth_handler.add_password(realm=None,
uri=r'http://website/',
user='admin',
passwd='pass')
opener = urllib.request.build_opener(auth_handler)
urllib.request.install_opener(opener)
url = 'http://www.website.com/example.pdf'
res = opener.open(url)
urllib.request.urlretrieve(url, "example.pdf")
我想问题出在“urllib.request.urlretrieve(url示例.pdf")". 完成身份验证后,请改用如下方法保存文件:
听起来你的网址不好。在浏览器中输入该URL时,请确保您的浏览器上有“.pdf”文件。在
编辑:
我想说的是,你的URL应该是这样的:“http://www.cse.msu.edu/~chooseun/Test2.pdf”你的代码必须能够从web地址提取这个pdf。希望这有帮助。在
相关问题 更多 >
编程相关推荐