Python中匹配正则表达式

2条回答

网友

1楼 · 编辑于 2024-05-21 05:55:28

您可能喜欢使用regex测试程序，例如http://regexpal.com/或{a2}。在

您遇到了一个问题，因为中间的(.*)将贪婪地匹配并最终捕获比您预期的更多的内容。见here。在

注意，我的解决方案应该匹配<number> <scale> <unit>的所有实例，而不仅仅是每行的第一个实例。我把它留给后人。在

(?:[^0-9$]|^)(\d+)\s(\w+)\s(\w+)

在这里，它在起作用，link。在

(?:[^0-9$]|^)表示匹配要么从行首开始，要么前面不是数字或美元符号（?:表示我们不想捕捉它）。然后匹配数字\d+，后面跟着两个单词\w+。你可以用更具描述性的匹配来代替\w+，就像perreal的回答一样。在

网友

2楼 · 编辑于 2024-05-21 05:55:28

import re
with open("input") as f:
    for line in f:
        mo=re.match(r'[^\d]*(\d+).*?(tons|feet|lbs)', line)
        if mo: print mo.group(1), mo.group(2)

输出

^{pr2}$

另外，如果您有一个类似$100 money is too much for 100 lbs的行，则可以使用以下命令：

import re
with open("input") as f:
    for line in f:
        mo=re.match(r'.*?(?<![$\d])(\d+).*?(tons|feet|lbs)', line)
        if mo: print mo.group(1), mo.group(2)

为了配合千斤重的东西：

import re
with open("input") as f:
    for line in f:
        mo=re.match(r'.*?(\d+).*?(mega|kilo|metric|) (tons|feet|lbs)', line)
        if mo: print mo.group(1), mo.group(2), mo.group(3)

输出

1023 mega lbs
1023 kilo tons
1023  feet
100  lbs

可以将这些单元和修饰符存储在列表中，并将它们与|连接起来，以动态创建regex。在

匹配所有可能的单位修饰符的示例：

import re
with open("input") as f:
    for line in f:
        mo=re.match(r'[^\d]*(\d+).*?(\S*)\s*(tons|feet|lbs)', line)
        if mo: print "'{}' '{}' '{}'".format(mo.group(1), mo.group(2), 
                       mo.group(3))

输出

'1023' 'mega' 'lbs'
'1023' 'kilo' 'tons'
'1023' '' 'feet'

相关问题更多 >

编程相关推荐

热门问题

热门文章