解码从HTTP流中提取的Cookie变量 - Python

2 投票

1 回答

8809 浏览

提问于 2025-04-16 12:37

我正在用Python向一个服务器发送请求，然后从服务器那里得到了一个cookie。我想弄明白这个cookie是用什么编码方式的，我猜可能是utf-8或者base64。

resp, content = httpobj.request(server, 'POST', headers=HTTPheader, body=HTTPbody)

接着，我从HTTP流中提取了这个cookie。

cookie= resp['set-cookie']

我尝试过用 str.decode() 和 unicode()，但是我还是无法得到cookie的解码内容。

假设这个cookie是：

MjAyMTNiZWE4ZmYxYTMwOVPJ7Jh0B%2BMUcE4si5oDcH7nKo4kAI8CMYgKqn6yXpgtXOSGs8J9gm20bgSlYMUJC5rmiQ1Ch5nUUlQEQNmrsy5LDgAuuidQaZJE5z%2BFqAJPnlJaAqG2Fvvk5ishG%2FsH%2FA%3D%3D

我期望的输出是：

20213bea8ff1a309SÉì˜tLQÁ8².hÁûœª8<Æ *©úÉzµs’Ïö¶Ñ¸•ƒ$.kš$5gQIPf®Ì¹,8�ºèA¦IœöZ€$ùå% *ao¾Nb²¶ÁöÃ

data extraction http utf-8 cookie base64 http request encoding decoding

1 个回答

对于Python 3来说，unquote这个函数是在parse这个子模块里面。

import urllib
import base64

cookie_val = """MjAyMTNiZWE4ZmYxYTMwOVPJ7Jh0B%2BMUcE4si5oDcH7nKo4kAI8CMYgKqn6yXpgtXOSGs8J9gm20bgSlYMUJC5rmiQ1Ch5nUUlQEQNmrsy5LDgAuuidQaZJE5z%2BFqAJPnlJaAqG2Fvvk5ishG%2FsH%2FA%3D%3D"""

res =  base64.b64decode(urllib.parse.unquote(cookie_val))

print(repr(res))

而对于Python 2，这个函数可以直接使用。

import urllib
import base64

cookie_val = """MjAyMTNiZWE4ZmYxYTMwOVPJ7Jh0B%2BMUcE4si5oDcH7nKo4kAI8CMYgKqn6yXpgtXOSGs8J9gm20bgSlYMUJC5rmiQ1Ch5nUUlQEQNmrsy5LDgAuuidQaZJE5z%2BFqAJPnlJaAqG2Fvvk5ishG%2FsH%2FA%3D%3D"""

res =  base64.b64decode(urllib.unquote(cookie_val))

print repr(res)

输出结果：

"20213bea8ff1a309S\xc9\xec\x98t\x07\xe3\x14pN,\x8b\x9a\x03p~\xe7*\x8e$\x00\x8f\x021\x88\n\xaa~\xb2^\x98-\\\xe4\x86\xb3\xc2}\x82m\xb4n\x04\xa5`\xc5\t\x0b\x9a\xe6\x89\rB\x87\x99\xd4RT\x04@\xd9\xab\xb3.K\x0e\x00.\xba'Pi\x92D\xe7?\x85\xa8\x02O\x9eRZ\x02\xa1\xb6\x16\xfb\xe4\xe6+!\x1b\xfb\x07\xfc"

当然，这里的结果是一个8位字符串，所以你需要对它进行解码，才能得到你想要的字符串。我不太确定用哪种编码方式，但这里是用unicode-escape（unicode字面量）解码后的结果：

>>> print unicode(res, 'unicode-escape') 
20213bea8ff1a309SÉìtãpN,p~ç*$1ª~²^-\ä³Â}m´n¥`ÅBÔRT@Ù«³.K.º'PiDç?¨ORZ¡¶ûäæ+!ûü

希望这些能对你有所帮助。

回答于 2025-04-16 由 Python大师

分享举报

解码从HTTP流中提取的Cookie变量 - Python

1 个回答

撰写回答