Python Regex在单行上反向/负匹配而不是在多行上，不使用SPLIT（），并且不测试以前的匹配组

>>> qw ='hoho hihi haha hede rara a rere titi so whdhdskhdshede wekjewhkwqjhededjfjfj so kjkfdjkdnekjdhide b hede kdjkdld' >>> re.findall('{SOMETHING_THAT_INCLUDES_ALL_STRINGS_NOT_COTAINING_hede_AND_BREAKS_THEM_IF_THEY_DO}', qw) ['hoho', 'hihi', 'haha', 'rara', 'a', 'rere', 'titi', 'so', 'whdhdskhds', 'wekjewhkwqj', 'djfjfj', 'so' 'kjkfdjkdnekjdhide', 'b', 'kdjkdld']

>>> qw ='hoho hihi haha hede rara a rere titi so whdhdskhdshede wekjewhkwqjhededjfjfj so kjkfdjkdnekjdhide b hede kdjkdld' >>> re.findall('[\S]+(?=hede)|(?<=hede )[\S]+|(?<=hede)[\S]+|[\S]+(?= hede)|[\S]+(?=hede )|(?<= hede)[\S]+', qw) ['haha', 'rara', 'whdhdskhds', 'wekjewhkwqj', 'djfjfj', 'b', 'kdjkdld']

1条回答

网友

1楼 · 发布于 2024-05-23 14:30:40

我建议利用仅返回捕获文本的^{}功能：

If one or more groups are present in the pattern, return a list of groups; this will be a list of tuples if the pattern has more than one group. Empty matches are included in the result unless they touch the beginning of another match.

因此，您可以匹配并捕获您需要的内容，而只需匹配您需要的跳过。请参见Python演示：

import re
qw ='hoho hihi haha hede rara a rere titi so whdhdskhdshede wekjewhkwqjhededjfjfj so kjkfdjkdnekjdhide b hede kdjkdld'
rx = r'hede|((?:(?!hede)\S)+)'
results = re.findall(rx, qw)
print(filter(None, results))
# => ['hoho', 'hihi', 'haha', 'rara', 'a', 'rere', 'titi', 'so', 'whdhdskhds', 'wekjewhkwqj', 'djfjfj', 'so', 'kjkfdjkdnekjdhide', 'b', 'kdjkdld']

参见Python demo。在

由于hede未被捕获，因此不会返回它，但是由于有1个捕获组并且它不参与匹配，所以每次与未捕获的模式匹配时，都会向结果列表中添加一个空字符串。在

图案细节

hede-匹配hede
|-或
((?:(?!hede)\S)+)-匹配并将一个或多个非空白字符捕获到组1中，这些字符不是hede序列的起始点。在

请注意，如果使用PyPi ^{} modile，则可以使用PCRE-like verbs ^{}：

^{pr2}$

那么，就不需要filter结果了。在

相关问题更多 >

编程相关推荐

热门问题

热门文章