解码从HTTP流中提取的Cookie变量 - Python

2 投票
1 回答
8809 浏览
提问于 2025-04-16 12:37

我正在用Python向一个服务器发送请求,然后从服务器那里得到了一个cookie。我想弄明白这个cookie是用什么编码方式的,我猜可能是utf-8或者base64。

resp, content = httpobj.request(server, 'POST', headers=HTTPheader, body=HTTPbody)

接着,我从HTTP流中提取了这个cookie。

cookie= resp['set-cookie']

我尝试过用 str.decode()unicode(),但是我还是无法得到cookie的解码内容。

假设这个cookie是:

MjAyMTNiZWE4ZmYxYTMwOVPJ7Jh0B%2BMUcE4si5oDcH7nKo4kAI8CMYgKqn6yXpgtXOSGs8J9gm20bgSlYMUJC5rmiQ1Ch5nUUlQEQNmrsy5LDgAuuidQaZJE5z%2BFqAJPnlJaAqG2Fvvk5ishG%2FsH%2FA%3D%3D

我期望的输出是:

20213bea8ff1a309SÉì˜tLQÁ8².hÁûœª8<Æ *©úÉzµs’Ïö¶Ñ¸•ƒ$.kš$5gQIPf®Ì¹,8�ºèA¦IœöZ€$ùå% *ao¾Nb²¶ÁöÃ

1 个回答

3

对于Python 3来说,unquote这个函数是在parse这个子模块里面。

import urllib
import base64

cookie_val = """MjAyMTNiZWE4ZmYxYTMwOVPJ7Jh0B%2BMUcE4si5oDcH7nKo4kAI8CMYgKqn6yXpgtXOSGs8J9gm20bgSlYMUJC5rmiQ1Ch5nUUlQEQNmrsy5LDgAuuidQaZJE5z%2BFqAJPnlJaAqG2Fvvk5ishG%2FsH%2FA%3D%3D"""

res =  base64.b64decode(urllib.parse.unquote(cookie_val))

print(repr(res))

而对于Python 2,这个函数可以直接使用。

import urllib
import base64

cookie_val = """MjAyMTNiZWE4ZmYxYTMwOVPJ7Jh0B%2BMUcE4si5oDcH7nKo4kAI8CMYgKqn6yXpgtXOSGs8J9gm20bgSlYMUJC5rmiQ1Ch5nUUlQEQNmrsy5LDgAuuidQaZJE5z%2BFqAJPnlJaAqG2Fvvk5ishG%2FsH%2FA%3D%3D"""

res =  base64.b64decode(urllib.unquote(cookie_val))

print repr(res)

输出结果:

"20213bea8ff1a309S\xc9\xec\x98t\x07\xe3\x14pN,\x8b\x9a\x03p~\xe7*\x8e$\x00\x8f\x021\x88\n\xaa~\xb2^\x98-\\\xe4\x86\xb3\xc2}\x82m\xb4n\x04\xa5`\xc5\t\x0b\x9a\xe6\x89\rB\x87\x99\xd4RT\x04@\xd9\xab\xb3.K\x0e\x00.\xba'Pi\x92D\xe7?\x85\xa8\x02O\x9eRZ\x02\xa1\xb6\x16\xfb\xe4\xe6+!\x1b\xfb\x07\xfc"

当然,这里的结果是一个8位字符串,所以你需要对它进行解码,才能得到你想要的字符串。我不太确定用哪种编码方式,但这里是用unicode-escape(unicode字面量)解码后的结果:

>>> print unicode(res, 'unicode-escape') 
20213bea8ff1a309SÉìtãpN,p~ç*$1ª~²^-\ä³Â}m´n¥`ÅBÔRT@Ù«³.K.º'PiDç?¨ORZ¡¶ûäæ+!ûü

希望这些能对你有所帮助。

撰写回答