如何安全地从URL获取文件扩展名？

3条回答

网友

1楼 · 编辑于 2024-05-15 01:59:57

真正的正确方法是根本不使用文件扩展名。对有问题的URL执行GET（或HEAD）请求，并使用返回的“Content type”HTTP头获取内容类型。文件扩展名不可靠。

有关更多信息和有用的MIME类型列表，请参见MIME types (IANA media types)。

网友

2楼 · 编辑于 2024-05-15 01:59:57

这对于requests和mimetypes来说是最简单的：

import requests
import mimetypes

response = requests.get(url)
content_type = response.headers['content-type']
extension = mimetypes.guess_extension(content_type)

扩展名包含一个点前缀。例如，extension是内容类型'image/png'的'.png'。

网友

3楼 · 编辑于 2024-05-15 01:59:57

使用urlparse解析URL外的路径，然后使用os.path.splitext获取扩展名。

import urlparse, os

url = 'http://www.plssomeotherurl.com/station.pls?id=111'
path = urlparse.urlparse(url).path
ext = os.path.splitext(path)[1]

请注意，扩展名可能不是文件类型的可靠指示器。HTTPContent-Type头可能更好。

相关问题更多 >

编程相关推荐

热门问题

热门文章

如何安全地从URL获取文件扩展名？

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >