如何使用Python3（带regex）查找以字节为单位的十六进制字符串的大小

2条回答

网友

1楼 · 编辑于 2024-04-26 01:37:07

我建议

l = re.compile("\x01\x03(?(?!\x01\x03).)*").split(s)
len(l) - 1

试验结果：

>>> re.compile(r"\x01\x03").split(b"\x01\x03\0x4\0x5\x01\x03\0x6\0x7")
['', '\x00x4\x00x5', '\x00x6\x00x7']

当然你应该确保正则表达式是正确的。你知道吗

网友

2楼 · 编辑于 2024-04-26 01:37:07

您可以使用enumerate：

regex = b'\x01\x03(?(?!\x01\x03).)*'

chunk_lengths = {index: len(chunk) for index, chunk in enumerate(re.findall(regex, data))}

您最初使用re.findall获取源数据中遵循给定正则表达式的每个块。它们是bytes对象，具有明确定义的长度（其中的字节数）。你知道吗

使用len操作符，我们可以找到每个块的长度，这些长度将构成我们字典的值。如果我们做了[len(chunk) for chunk in re.findall(regex, data))]，那会给我们一个所有找到的块的长度列表，按照它们被发现的顺序排列（这在后面会很重要）。你知道吗

enumerate是一个内置函数，允许对某个iterable对象的索引（默认从0开始）进行“标记”。所以，假设您有一个list[5, 3, 4]，表示块长度。如果对其应用enumerate，则会得到tuples(0, 5)（索引0，长度5）、(1, 3)（索引1，长度3）和(2, 4)（索引2，长度4）。你知道吗

现在，通过将所有内容放在dict理解中，我们可以通过enumerate创建的索引来访问块的长度。如上所述，findall按顺序返回结果列表，枚举也按顺序操作，因此enumerate创建的索引也是块在原始数据中的相对位置。你知道吗

相关问题更多 >

编程相关推荐

热门问题

热门文章