Python中用正则表达式提取子串

网友

1楼 · 编辑于 2024-04-20 06:02:22

解决方法之一是使用配分函数。有一个例子

string = 'I am John'
words = ['am','is','are']

for word in words :
    before,word,after = string.partition(word)
    print (after)

输出：

^{pr2}$

网友

2楼 · 编辑于 2024-04-20 06:02:22

在这种情况下，我喜欢使用finditer，因为它返回的匹配对象比findall返回的字符串更容易操作。可以继续匹配am/is/are，但也可以将字符串的其余部分与第二个子组匹配，然后从结果中仅提取该组。在

>>> import re
>>> string = 'I am John'
>>> [m.group(2) for m in re.finditer("(am|is|are)(.*)", string)]
[' John']

根据您的模式结构，我猜您最多只希望字符串中有一个匹配项。考虑使用re.search而不是findall或finditer。在

^{pr2}$

如果您认为“实际上我想匹配am/is/are后面的单词的每个实例，而不仅仅是第一个”，这是个问题，因为您的.*组件将匹配第一个am/is/are之后的字符串的其余部分。E、 g.对于字符串"I am John and he is Steve"，它将匹配' John and he is Steve'。如果你想让John和Steve分开，也许你可以限制你想要匹配的字符类。\w似乎很明智：

>>> string = "I am John and he is Steve"
>>> [m.group(2) for m in re.finditer(r"(am|is|are) (\w*)", string)]
['John', 'Steve']

网友

3楼 · 编辑于 2024-04-20 06:02:22

import re

s = 'I am John'

g = re.findall(r'(?:am|is|are)\s+(.*)', s)
print(g)

印刷品：

^{pr2}$

相关问题更多 >

编程相关推荐

热门问题

热门文章