如何在python中使用正则表达式查找某些单词？

网友

1楼 · 编辑于 2024-05-15 01:09:39

您的模式正在寻找：

它没有选择“Z101”，因为当您添加“Y”时，该子字符串的前面不会紧跟着“（”或“+”）

一个选项是在模式中保留1和4。在本例中，您将完全得到您想要的。该模式将是r'[XYZ]\d\d\d。但是，根据您的数据，这可能会产生不同的问题

另一个选项是包含前缀字符带“？”的可能性。当用作量词时，“？”表示“零或一”（但它也可以修改其他量词，但这是另一个主题）。为此，您的模式将是r“[（+][XYZ]？（[XYZ]\d\d\d）[）+]”

网友

2楼 · 编辑于 2024-05-15 01:09:39

左侧和右侧边界模式（[\(\+]和[\)\+]）正在使用它们匹配的文本，因此不会检测到连续的匹配

你可以解决这个问题using lookarounds

r"(?<=[(+])([XYZ]\d\d\d)(?=[)+])"
r"(?<=[(+])[XYZ]\d{3}(?=[)+])"

详细信息

注意word boundary，\b，在某些情况下可以解决这个问题，在这里它也可能对您有所帮助

网友

3楼 · 编辑于 2024-05-15 01:09:39

将re.findall与模式[XYZ]\d{3}\b一起使用：

test = '"(YZ101+Z102+Z1034+Z104)/4"'
matches = re.findall(r'[XYZ]\d{3}\b', test)
print(matches)  # ['Z101', 'Z102', 'Z104']