从hyperlin下载文件

2024-03-28 13:21:41 发布

您现在位置:Python中文网/ 问答频道 /正文

初学者在这里,尝试编写脚本在python3.x下载文件后,每天登录到一个网站。该文件嵌入在超链接中,通常在单击下载时,会出现操作系统弹出窗口,询问保存位置。我似乎一切正常,除了它下载/写入文件后,我打开文件找到消息“页面无法显示,因为发生了内部服务器错误”,而不是我希望找到的文件文本。在这一点上,我想它可能是超链接的问题所在(它每天根据日期变化,所以我合并了一个datetime语句来解释它)。我试过使用像BeautifuSoup和Selenium之类的东西,并且在这里浏览了几十篇其他的帖子,但是还没有找到一个解决方案。虽然他们走近了,但还是没有雪茄。思想?你知道吗

代码:

today = datetime.datetime.now()
todays_file = today.strftime('%Y%m%d')

file_url = 'https://site.url/file.url'
site_url = 'https://site.url'
s = requests.Session()
s.get(site_url)
s.post(site_url,data={'username':’username’,'dept':’dept’,'password':’password’})
the_file = s.get(file_url)
with open(‘file.txt','wb') as f:
     f.write(the_file.content)

Tags: 文件thehttps脚本urlgettodaydatetime