带“*”的“re.sub”方法

2024-05-29 06:30:28 发布

您现在位置:Python中文网/ 问答频道 /正文

我在使用python re库时遇到了以下行为

>>> import re
>>> re.sub(pattern=".*", repl="r", string="hello")
'rr'

如您所见,对于模式.*和替换字符(rre.sub方法,返回rr。但是我希望结果是r,因为.*将匹配整个字符串。为什么?。我也在Go中测试了同样的逻辑,但它返回了预期的结果

package main

import (
    "fmt"
    "regexp"
)

func main() {
    re := regexp.MustCompile(`.*`)
    fmt.Println(re.ReplaceAllString("Hello", "r")) // Will print `r`
}

Tags: 方法字符串importregohellostringmain
1条回答
网友
1楼 · 发布于 2024-05-29 06:30:28

下面应该开始解释发生了什么:

>>> re.sub("x?", "_", "hello")
'_h_e_l_l_o_'

在字符串中的每个位置re.sub尝试匹配x?。它成功了,因为x?可以匹配空字符串,并用_替换空字符串

以类似的方式,在下面

>>> re.sub(".*", "r", "hello")
'rr'

我们发现re.sub尝试匹配位置0中的.*,成功并使用整个字符串。然后它尝试在结束位置匹配,成功(匹配空字符串)并再次用r替换它。如果您不允许空匹配,则“困惑”行为将消失:

>>> re.sub(".+", "r", "hello")
'r'

在Python3.7之前的版本中,如果re.sub使用了整个字符串,那么它将不会再次尝试在末尾进行匹配,而在Python3.7+中则会这样做。更具体地说,引用re.sub的文档:

Changed in version 3.7: Empty matches for the pattern are replaced when adjacent to a previous non-empty match.

Python 3.7+(一致的行为)

>>> matches = lambda r, s: [m.span() for m in re.finditer(r, s)]
>>> matches("x?", "x")
[(0, 1), (1, 1)]
>>> matches("x?", "y")
[(0, 0), (1, 1)]
>>> re.sub("x?", "r", "x")
'rr'
>>> re.sub("x?", "r", "y")
'ryr

Python 3.6(不一致行为)

>>> matches("x?", "x")
[(0, 1), (1, 1)]
>>> matches("x?", "y")
[(0, 0), (1, 1)]
>>> re.sub("x?", "r", "x")
'r'
>>> re.sub("x?", "r", "y")
'ryr'

相关问题 更多 >

    热门问题