解码从HTTP流中提取的Cookie变量 - Python
我正在用Python向一个服务器发送请求,然后从服务器那里得到了一个cookie。我想弄明白这个cookie是用什么编码方式的,我猜可能是utf-8或者base64。
resp, content = httpobj.request(server, 'POST', headers=HTTPheader, body=HTTPbody)
接着,我从HTTP流中提取了这个cookie。
cookie= resp['set-cookie']
我尝试过用 str.decode()
和 unicode()
,但是我还是无法得到cookie的解码内容。
假设这个cookie是:
MjAyMTNiZWE4ZmYxYTMwOVPJ7Jh0B%2BMUcE4si5oDcH7nKo4kAI8CMYgKqn6yXpgtXOSGs8J9gm20bgSlYMUJC5rmiQ1Ch5nUUlQEQNmrsy5LDgAuuidQaZJE5z%2BFqAJPnlJaAqG2Fvvk5ishG%2FsH%2FA%3D%3D
我期望的输出是:
20213bea8ff1a309SÉì˜t
LQÁ8².hÁûœª8<Æ *©úÉz
µs’Ïö¶Ñ¸•ƒ$.kš$5gQIPf®Ì¹,8�ºèA¦IœöZ€$ùå% *ao¾Nb²¶ÁöÃ
1 个回答
3
对于Python 3来说,unquote
这个函数是在parse
这个子模块里面。
import urllib
import base64
cookie_val = """MjAyMTNiZWE4ZmYxYTMwOVPJ7Jh0B%2BMUcE4si5oDcH7nKo4kAI8CMYgKqn6yXpgtXOSGs8J9gm20bgSlYMUJC5rmiQ1Ch5nUUlQEQNmrsy5LDgAuuidQaZJE5z%2BFqAJPnlJaAqG2Fvvk5ishG%2FsH%2FA%3D%3D"""
res = base64.b64decode(urllib.parse.unquote(cookie_val))
print(repr(res))
而对于Python 2,这个函数可以直接使用。
import urllib
import base64
cookie_val = """MjAyMTNiZWE4ZmYxYTMwOVPJ7Jh0B%2BMUcE4si5oDcH7nKo4kAI8CMYgKqn6yXpgtXOSGs8J9gm20bgSlYMUJC5rmiQ1Ch5nUUlQEQNmrsy5LDgAuuidQaZJE5z%2BFqAJPnlJaAqG2Fvvk5ishG%2FsH%2FA%3D%3D"""
res = base64.b64decode(urllib.unquote(cookie_val))
print repr(res)
输出结果:
"20213bea8ff1a309S\xc9\xec\x98t\x07\xe3\x14pN,\x8b\x9a\x03p~\xe7*\x8e$\x00\x8f\x021\x88\n\xaa~\xb2^\x98-\\\xe4\x86\xb3\xc2}\x82m\xb4n\x04\xa5`\xc5\t\x0b\x9a\xe6\x89\rB\x87\x99\xd4RT\x04@\xd9\xab\xb3.K\x0e\x00.\xba'Pi\x92D\xe7?\x85\xa8\x02O\x9eRZ\x02\xa1\xb6\x16\xfb\xe4\xe6+!\x1b\xfb\x07\xfc"
当然,这里的结果是一个8位字符串,所以你需要对它进行解码,才能得到你想要的字符串。我不太确定用哪种编码方式,但这里是用unicode-escape(unicode字面量)解码后的结果:
>>> print unicode(res, 'unicode-escape')
20213bea8ff1a309SÉìtãpN,p~ç*$1ª~²^-\ä³Â}m´n¥`ÅBÔRT@Ù«³.K.º'PiDç?¨ORZ¡¶ûäæ+!ûü
希望这些能对你有所帮助。