通过TCP接收的Python字符串中的非二进制(十六进制)字符
可能这是个新手问题,但我通过TCP接收了一些数据,当我查看这个字符串时,得到了以下内容:
\x00\r\xeb\x00\x00\x00\x00\x01t\x00
这里的 \r
字符是什么?而 \x01t
中的 t
又是什么意思呢?
我试着在网上搜索,但不知道该搜索什么...
谢谢。
3 个回答
2
当我们把数据以字符串的形式展示出来时,可打印的字符(比如't')会直接显示为字符,而一些已知的控制序列则会以转义字符的形式显示,其他的字节则会以\x##的格式展示。举个例子:
>>> s='\x74\x0d\x99'
>>> s
't\r\x99'
你可以用以下方式输出十六进制形式:
>>> import binascii
>>> binascii.hexlify(s)
'740d99'
9
\r
是一个回车符(0x0d),而 t
就是字母 t
。
4
查看字符串中的二进制数据有时候会让人感到困惑,特别是当数据很长的时候。不过,你可以把它转换成更容易阅读的十六进制格式。
>>> data = '\x00\r\xeb\x00\x00\x00\x00\x01t\x00'
>>> ' '.join(["%02X" % ord(char) for char in data])
'00 0D EB 00 00 00 00 01 74 00'
另外,如果你只是想把字节字符串解析成不同的字段,那就不用管字符串本身,直接使用 struct
模块来解包就可以了:
>>> import struct
>>> length, command, eggs, spam = struct.unpack('!BBi4s',data)
>>> #...whatever your fields really are
>>> print "len: %i\ncmd: %i\negg qty: %i\nspam flavor: '%s'" % (
... length, command, eggs, spam)
len: 0
cmd: 13
egg qty: -352321536
spam flavor: ' ☺t '