Python有解析HTTP请求和响应的模块吗?
httplib(现在叫http.client)和相关的库都有conn.getresponse()和一个HTTPResponse类,但在服务器端,conn.getrequest()和一个HTTPRequest类似乎没有提供。
我知道BaseHTTPServer和BaseHTTPRequestHandler可以实现这个功能,但它们并没有把这些方法开放给模块外部使用。
简单来说,我希望BaseHTTPRequestHandler#parse_request能变成一个静态方法,直接返回一个HTTPRequest对象,而不是填充成员变量。
3 个回答
2
你可能会觉得 WebOb 很有用。像 Pylons、Turbogears 和 Bfg 这样的框架都把它作为他们的一部分功能。需要注意的是,它是基于 WSGI 的,也就是说你得在这个环境下工作。
2
如果你想进行服务器端处理,可以看看 wsgiref 这个东西。
WSGI标准会把请求解析成一个简单的字典,里面包含了所有相关的头信息和元素。
47
杰夫,为了能解析HTTP请求,我创建了一个只有九行代码的小类,这个类是基于基本的HTTP请求处理器的:
from BaseHTTPServer import BaseHTTPRequestHandler
from StringIO import StringIO
class HTTPRequest(BaseHTTPRequestHandler):
def __init__(self, request_text):
self.rfile = StringIO(request_text)
self.raw_requestline = self.rfile.readline()
self.error_code = self.error_message = None
self.parse_request()
def send_error(self, code, message):
self.error_code = code
self.error_message = message
现在,你可以拿一个包含HTTP请求文本的字符串,通过创建这个类的实例来解析它:
# Simply instantiate this class with the request text
request = HTTPRequest(request_text)
print request.error_code # None (check this first)
print request.command # "GET"
print request.path # "/who/ken/trust.html"
print request.request_version # "HTTP/1.1"
print len(request.headers) # 3
print request.headers.keys() # ['accept-charset', 'host', 'accept']
print request.headers['host'] # "cm.bell-labs.com"
# Parsing can result in an error code and message
request = HTTPRequest('GET\r\nHeader: Value\r\n\r\n')
print request.error_code # 400
print request.error_message # "Bad request syntax ('GET')"