从URL检索文件并保存扩展名正确的文件

2024-03-29 15:31:37 发布

您现在位置:Python中文网/ 问答频道 /正文

我想创建一个简单的基于Python的实用程序,它可以从一个web页面获取所有下载url并下载内容。我发现有几种方法可以做到这一点,我发现最好的方法是“urllib”。但不幸的是,我的问题是,我不能保存那些与适当的扩展,因为网址如下所示

http://example.com/2w3xa75

但内容可以是不同的格式,如mp3、ogg等

如何识别类型并用正确的扩展名保存这些内容。你知道吗


Tags: 方法实用程序comwebhttpurl类型内容
1条回答
网友
1楼 · 发布于 2024-03-29 15:31:37

你可以使用^{}^{}

其思想是提取Content-TypeHTTP头并请求mimetypes猜测相关的扩展。你知道吗

我将以这个问题的URL为例(它不提供扩展名)

import requests
import mimetypes

query = requests.get('https://stackoverflow.com/questions/45488909/retrieve-files-from-urls-and-save-those-with-correct-extension')
content_type = query.headers['Content-Type']

print(mimetypes.guess_extension(content_type.split(';')[0]))

输出:

.html

一个Content-Type头就像:'text/html; charset=utf-8',但是^{}只需要第一部分(text/html),这就是我拆分它的原因。你知道吗

相关问题 更多 >