如何使用python过滤掉这种特殊的模式芬德尔先生?

2024-06-16 10:44:42 发布

您现在位置:Python中文网/ 问答频道 /正文

我想在一个长字符串中找出一些特殊的关键字。 以下是示例:

long_str = '''
TX[03]
rqn : 0x73
cqn : 0x12
packets : 888
encap : 0
csumNone : 0
csumOk : 0
lroPackets : 0
lroBytes : 0
wqeErr : 0
RX[12]
rqn : 0xa6
cqn : 0x2a
packets : 123
encap : 0
csumNone : 0
csumOk : 0
lroPackets : 0
lroBytes : 0
wqeErr : 0

RX[13]
rqn : 0xa9
cqn : 0x2c
packets : 456
encap : 0
csumNone : 0
csumOk : 0
lroPackets : 0
lroBytes : 0
wqeErr : 0'''
result = re.findall('RX\[\d+\].*packets\s+:\s+(\d+)', a, re.DOTALL)

但是result是{},这与我期望的['123','456']不一样。在

如何修复重新模式以筛选出预期值?在

提前谢谢。在


Tags: 字符串re示例关键字resultrxpacketsencap
2条回答

最简单的解决方案是让它变懒:

RX\[\d+\].*?packets\s+:\s+(\d+) 

请看working on regex101.com
否则,您的.*构造会占用整个字符串并在之后回溯(即找到最后一个packets时成功)。


会是另一个: ^{pr2}$

请参见this one working here(注意不同的修改器!)。在

如文档https://docs.python.org/2/library/re.html中所述,'*''+'和{}限定符都是贪婪的;它们尽可能多地匹配文本。有时这种行为并不理想;如果RE <.*><a> b <c>匹配,它将匹配整个字符串,而不仅仅是<a>。在限定符后添加?使其以非贪婪或最小的方式执行匹配;将匹配尽可能少的字符。使用RE <.*?>将只匹配<a>。在

类似地,在您的例子中,result = re.findall('RX\[\d+\].*?packets\s+:\s+(\d+)', a, re.DOTALL)将给出预期的结果。在

相关问题 更多 >