Python正则表达式：如何查找子字符串

2条回答

网友

1楼 · 编辑于 2024-04-19 07:48:17

您需要的是一个正则表达式，它在一个点之前排除一系列内容：

"[^a-zA-Z0-9]CTO"

但实际上，您还需要检查CTO何时出现在行的开头：

"^CTO"

要使用re.sub中的第一个表达式，可以添加分组运算符（()），然后在替换中使用它来提取匹配字符（例如空格或/）：

re.sub("([^a-zA-Z0-9])CTO","\\1Chief Technology Officer", "foo/CTO")

将导致

'foo/Chief Technology Officer'

网友

2楼 · 编辑于 2024-04-19 07:48:17

回答："(?<=[^a-zA-Z0-9])CTO|^CTO"

Lookbehinds是完美的选择

cto_re = re.compile("(?<=[^a-zA-Z0-9])CTO")

但不幸的是，这不适用于行的开头（因为python实现需要固定长度）

for eg in "Co-Founder/CTO", "CTO/Bossy", "aCTOrMan":
    print(cto_re.sub("Chief Technology Officer", eg))

Co-Founder/Chief Technology Officer
CTO/Bossy
aCTOrMan

您必须通过|明确检查这一点：

cto_re = re.compile("(?<=[^a-zA-Z0-9])CTO|^CTO")

for eg in "Co-Founder/CTO", "CTO/Bossy", "aCTOrMan":
    print(cto_re.sub("Chief Technology Officer", eg))

Co-Founder/Chief Technology Officer
Chief Technology Officer/Bossy
aCTOrMan

相关问题更多 >

编程相关推荐

热门问题

热门文章

Python正则表达式：如何查找子字符串

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >