如何使用python过滤掉这种特殊的模式芬德尔先生？

long_str = ''' TX[03] rqn : 0x73 cqn : 0x12 packets : 888 encap : 0 csumNone : 0 csumOk : 0 lroPackets : 0 lroBytes : 0 wqeErr : 0 RX[12] rqn : 0xa6 cqn : 0x2a packets : 123 encap : 0 csumNone : 0 csumOk : 0 lroPackets : 0 lroBytes : 0 wqeErr : 0 RX[13] rqn : 0xa9 cqn : 0x2c packets : 456 encap : 0 csumNone : 0 csumOk : 0 lroPackets : 0 lroBytes : 0 wqeErr : 0''' result = re.findall('RX\[\d+\].*packets\s+:\s+(\d+)', a, re.DOTALL)

2条回答

网友

1楼 · 编辑于 2024-06-16 10:44:42

最简单的解决方案是让它变懒：

RX\[\d+\].*?packets\s+:\s+(\d+)

请看working on regex101.com。
否则，您的.*构造会占用整个字符串并在之后回溯（即找到最后一个packets时成功）。

会是另一个： ^{pr2}$

请参见this one working here（注意不同的修改器！）。在

网友

2楼 · 编辑于 2024-06-16 10:44:42

如文档https://docs.python.org/2/library/re.html中所述，'*'、'+'和{}限定符都是贪婪的；它们尽可能多地匹配文本。有时这种行为并不理想；如果RE <.*>与<a> b <c>匹配，它将匹配整个字符串，而不仅仅是<a>。在限定符后添加?使其以非贪婪或最小的方式执行匹配；将匹配尽可能少的字符。使用RE <.*?>将只匹配<a>。在

类似地，在您的例子中，result = re.findall('RX\[\d+\].*?packets\s+:\s+(\d+)', a, re.DOTALL)将给出预期的结果。在

相关问题更多 >

编程相关推荐

热门问题

热门文章