bz2使用Python3.4解压缩类型错误：“str”不支持中的缓冲区

import bz2 un = 'BZh91AY&SYA\xaf\x82\r\x00\x00\x01\x01\x80\x02\xc0\x02\x00 \x00!\x9ah3M\x07<]\xc9\x14\xe1BA\x06\xbe\x084' pw = 'BZh91AY&SY\x94$|\x0e\x00\x00\x00\x81\x00\x03$ \x00!\x9ah3M\x13<]\xc9\x14\xe1BBP\x91\xf08' decoded_un = bz2.decompress(un) decoded_pw = bz2.decompress(pw) print(decoded_un) print(decoded_pw)

# http://www.pythonchallenge.com/pc/def/integrity.html import urllib.request import re import os.path import bz2 fname = "008.html" if not os.path.isfile(fname): url = 'http://www.pythonchallenge.com/pc/def/integrity.html' response = urllib.request.urlopen(url) webpage = response.read().decode("utf-8") with open(fname, "w") as fh: fh.write(webpage) with open(fname, "r") as fh: webpage = fh.read() re_un = '\\nun: \'(.*)\'\\n' m = re.search(re_un, webpage) un = m.group(1) print(un) pw_un = '\\npw: \'(.*)\'\\n' m = re.search(pw_un, webpage) pw = m.group(1) print(pw) unde = un.encode('latin-1').decode('unicode_escape').encode('latin1') pwde = pw.encode('latin-1').decode('unicode_escape').encode('latin1') decoded_un = bz2.decompress(unde) decoded_pw = bz2.decompress(pwde) print(decoded_un) print(decoded_pw)

1条回答

网友

1楼 · 发布于 2024-05-13 19:45:13

bz2库处理bytes对象，而不是字符串：

un = b'BZh91AY&SYA\xaf\x82\r\x00\x00\x01\x01\x80\x02\xc0\x02\x00 \x00!\x9ah3M\x07<]\xc9\x14\xe1BA\x06\xbe\x084'
pw = b'BZh91AY&SY\x94$|\x0e\x00\x00\x00\x81\x00\x03$ \x00!\x9ah3M\x13<]\xc9\x14\xe1BBP\x91\xf08'

换句话说，使用bytes()就可以了，只需确保使用了正确的编码。UTF-8不是这种编码方式；如果您将字节屏蔽为字符串字符编码点，请使用拉丁语1进行编码；拉丁语1将字符一对一映射到字节：

^{pr2}$

或者

un = bytes(un, 'latin1')

{另请参见^ a1：

^{bq}$

我把解码留给你。玩Python挑战吧！在

请注意，如果您从网页加载这些字符，它们将而不是！您将得到字符'\'、'x'、8和{}，而不是十六进制值为82的代码点。首先需要将这些序列解释为Python字符串文本：

>>> un = r'BZh91AY&SYA\xaf\x82\r\x00\x00\x01\x01\x80\x02\xc0\x02\x00 \x00!\x9ah3M\x07<]\xc9\x14\xe1BA\x06\xbe\x084'
>>> un
'BZh91AY&SYA\\xaf\\x82\\r\\x00\\x00\\x01\\x01\\x80\\x02\\xc0\\x02\\x00 \\x00!\\x9ah3M\\x07<]\\xc9\\x14\\xe1BA\\x06\\xbe\\x084'
>>> un.encode('latin-1').decode('unicode_escape')
'BZh91AY&SYA¯\x82\r\x00\x00\x01\x01\x80\x02À\x02\x00 \x00!\x9ah3M\x07<]É\x14áBA\x06¾\x084'
>>> un.encode('latin-1').decode('unicode_escape').encode('latin1')
b'BZh91AY&SYA\xaf\x82\r\x00\x00\x01\x01\x80\x02\xc0\x02\x00 \x00!\x9ah3M\x07<]\xc9\x14\xe1BA\x06\xbe\x084'

注意un表示中的双反斜杠。只有最后的bytes结果才是可解压缩的！在

相关问题更多 >

编程相关推荐

热门问题

热门文章