Python正则表达式从点分隔字母中删除点

import re texts = [ 'a.b.c', # Should be: 'abc' 'ab.c.dd.ee', # Should be: 'abcddee' 'a.b' # Should remain: 'a.b' ] for text in texts: text = re.sub(r'((\.)(?P<word>[a-zA-Z]{1,2})){2,}', r'\g<word>', text) print(text)

2条回答

网友

1楼 · 编辑于 2024-04-25 12:26:06

^(?=(?:.*?\.){2,}.*$)[a-z]{1,2}(?:\.[a-z]{1,2})+$

您可以使用它来匹配字符串。如果匹配，您可以使用任何简单的方法删除.

见演示

https://regex101.com/r/BrNBtk/1

网友

2楼 · 编辑于 2024-04-25 12:26:06

以.点开始匹配时，不要确保前面有一个char a-zA-Z

如果在替换中使用命名组word，它将包含上一次迭代的值，因为它本身在重复的组中

您可以将2个或多个点与字符a-zA-Z的1或2倍匹配，并在存在匹配项时用空字符串替换这些点

为了防止aaa.b.cc匹配，可以使用单词边界\b

\b[a-zA-Z]{1,2}(?:\.[a-zA-Z]{1,2}){2,}\b

模式匹配：

\b防止单词成为较大单词的一部分的单词边界
[a-zA-Z]{1,2}匹配字符a-zA-Z的1或2倍
(?:非捕获组
- \.[a-zA-Z]{1,2}匹配一个点和一个字符a-zA-Z的1或2倍
){2,}关闭非捕获组并重复2次或更多次以匹配至少2个点
\b单词边界

Regex demo Python demo

import re

pattern = r"\b[a-zA-Z]{1,2}(?:\.[a-zA-Z]{1,2}){2,}\b"
texts = [
    'a.b.c',
    'ab.c.dd.ee',
    'a.b',
    'aaa.b.cc'
]

for s in texts:
    print(re.sub(pattern, lambda x: x.group().replace(".", ""), s))

输出

abc
abcddee
a.b
aaa.b.cc

相关问题更多 >

编程相关推荐

热门问题

热门文章

Python正则表达式从点分隔字母中删除点

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >