2024-03-29 15:31:37 发布
网友
我想创建一个简单的基于Python的实用程序,它可以从一个web页面获取所有下载url并下载内容。我发现有几种方法可以做到这一点,我发现最好的方法是“urllib”。但不幸的是,我的问题是,我不能保存那些与适当的扩展,因为网址如下所示
http://example.com/2w3xa75
但内容可以是不同的格式,如mp3、ogg等
如何识别类型并用正确的扩展名保存这些内容。你知道吗
你可以使用^{}和^{}
其思想是提取Content-TypeHTTP头并请求mimetypes猜测相关的扩展。你知道吗
Content-Type
mimetypes
我将以这个问题的URL为例(它不提供扩展名)
import requests import mimetypes query = requests.get('https://stackoverflow.com/questions/45488909/retrieve-files-from-urls-and-save-those-with-correct-extension') content_type = query.headers['Content-Type'] print(mimetypes.guess_extension(content_type.split(';')[0]))
输出:
.html
一个Content-Type头就像:'text/html; charset=utf-8',但是^{}只需要第一部分(text/html),这就是我拆分它的原因。你知道吗
'text/html; charset=utf-8'
text/html
你可以使用^{} 和^{}
其思想是提取
Content-Type
HTTP头并请求mimetypes
猜测相关的扩展。你知道吗我将以这个问题的URL为例(它不提供扩展名)
输出:
一个} 只需要第一部分(
Content-Type
头就像:'text/html; charset=utf-8'
,但是^{text/html
),这就是我拆分它的原因。你知道吗相关问题 更多 >
编程相关推荐