Python有解析HTTP请求和响应的模块吗?

28 投票
3 回答
21170 浏览
提问于 2025-04-15 18:20

httplib(现在叫http.client)和相关的库都有conn.getresponse()和一个HTTPResponse类,但在服务器端,conn.getrequest()和一个HTTPRequest类似乎没有提供。

我知道BaseHTTPServer和BaseHTTPRequestHandler可以实现这个功能,但它们并没有把这些方法开放给模块外部使用。

简单来说,我希望BaseHTTPRequestHandler#parse_request能变成一个静态方法,直接返回一个HTTPRequest对象,而不是填充成员变量。

3 个回答

2

你可能会觉得 WebOb 很有用。像 Pylons、Turbogears 和 Bfg 这样的框架都把它作为他们的一部分功能。需要注意的是,它是基于 WSGI 的,也就是说你得在这个环境下工作。

2

如果你想进行服务器端处理,可以看看 wsgiref 这个东西。

WSGI标准会把请求解析成一个简单的字典,里面包含了所有相关的头信息和元素。

47

杰夫,为了能解析HTTP请求,我创建了一个只有九行代码的小类,这个类是基于基本的HTTP请求处理器的:

from BaseHTTPServer import BaseHTTPRequestHandler
from StringIO import StringIO

class HTTPRequest(BaseHTTPRequestHandler):
    def __init__(self, request_text):
        self.rfile = StringIO(request_text)
        self.raw_requestline = self.rfile.readline()
        self.error_code = self.error_message = None
        self.parse_request()

    def send_error(self, code, message):
        self.error_code = code
        self.error_message = message

现在,你可以拿一个包含HTTP请求文本的字符串,通过创建这个类的实例来解析它:

# Simply instantiate this class with the request text

request = HTTPRequest(request_text)

print request.error_code       # None  (check this first)
print request.command          # "GET"
print request.path             # "/who/ken/trust.html"
print request.request_version  # "HTTP/1.1"
print len(request.headers)     # 3
print request.headers.keys()   # ['accept-charset', 'host', 'accept']
print request.headers['host']  # "cm.bell-labs.com"

# Parsing can result in an error code and message

request = HTTPRequest('GET\r\nHeader: Value\r\n\r\n')

print request.error_code     # 400
print request.error_message  # "Bad request syntax ('GET')"

撰写回答