下载python文件时出现问题

2024-05-23 18:30:26 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在尝试使用请求下载文件。我正在python3.6.5上运行它。下面是我的代码:

import requests 
file_url = "http://codex.cs.yale.edu/avi/db-book/db4/slide-dir/ch1-2.pdf"

r = requests.get(file_url, stream = True) 

with open("python.pdf","wb") as pdf: 
    for chunk in r.iter_content(chunk_size=1024): 
        if chunk: 
            pdf.write(chunk)

获取以下错误:

ConnectionError: HTTPConnectionPool(host='codex.cs.yale.edu', port=80): Max retries exceeded with url: /avi/db-book/db4/slide-dir/ch1-2.pdf (Caused by NewConnectionError('<urllib3.connection.HTTPConnection object at 0x0000001421CF5080>: Failed to establish a new connection: [Errno 11002] getaddrinfo failed',))

我已经尝试了一些建议的方法来解决相同的问题,比如增加超时时间,但是没有帮助。而且,这个链接运行得非常好。你知道吗

你知道这里出了什么问题吗?你知道吗


Tags: urldbpdfdircsrequestsfileedu
2条回答

我建议使用查找假用户代理,例如https://pypi.org/project/fake-useragent/,并使用代理旋转来命中您试图命中的端点。 如何实现这些目标的一个很好的例子是https://www.scrapehero.com/how-to-rotate-proxies-and-ip-addresses-using-python-3/

问题出在远程终端。 不知何故,远程终端不会执行连接,它可能会抛出一个错误。它在我的个人电脑上运行得很好。你知道吗

谢谢大家的建议。你知道吗

相关问题 更多 >