为什么我的带有单词边界的正则表达式失败了？

网友

1楼 · 编辑于 2024-06-02 06:56:22

K和破折号之间的word boundary匹配。由于问号的原因，破折号[$€£]?-?后面的两个部分是可选的，然后一个数字匹配一次或多次。这将导致匹配-9

您可以使用一个断言来代替单词边界，该断言使用负lookbehind和负lookahead检查匹配前后的内容是否不是非空格字符\S。你知道吗

(?<!\S)-?[$€£]?(\d+(?:[,.]\d+)?)(?!\S)

网友

2楼 · 编辑于 2024-06-02 06:56:22

-9匹配，因为-是非单词字符，S是单词字符。。。所以在这两者之间有一个词间边界\b，正如您在regexp中所述。你知道吗

网友

3楼 · 编辑于 2024-06-02 06:56:22

这是因为\b匹配K和-之间的间隙，即单词和非单词字符。如果要避免匹配-如果它前面有一个单词，可以改用负lookback：

re.findall(r'[$€£]?(?:(?<!\w)-)?\d+[\d,.]*\b', test)

通过示例输入，将返回：

['9', '111', '3,33']