在一段文字中间匹配句子，直到我点击“Hello World”？

Lorem ipsum dolor sit amet, timeam evertitur ex eos, utamur temporibus disputationi eum te. Te pri dicant exerci nonumy, in case erat albucius mei. Pertinax periculis concludaturque eum te, et nam vero nominavi deterruisset. HELLO WORLD. Ex augue scriptorem pri. Vocent minimum quaerendum duo eu, habemus adipiscing ex eum.

3条回答

网友

1楼 · 编辑于 2024-04-28 22:47:06

您要查找的是所有出现一次或多次的字符.。你知道吗

并且您希望确保之后出现另一个模式，而不将其包含在匹配中，也称为“正向前瞻”(?=)。你知道吗

.+(?=HELLO WORLD)

Demo 1

如果要匹配换行符，只需使用s标志/修饰符来扩展.的含义。你知道吗

Demo 2

网友

2楼 · 编辑于 2024-04-28 22:47:06

您需要以下正则表达式：

(?s)(Te pri.*?)HELLO WORLD

分解一下，这个短语的意思是：

(?s)     Make the '.' regex metacharacter match newlines too
(        Start a capturing group
Te pri   Match exactly 'Te pri'
.        The dot metacharacter matches any character except newlines
*        Match the prior metacharacter, character class or group zero or more times
         By default will match as many times as possible
?        When paired with '*', it makes '*' match as few times as possible
         This way, '.*' doesn't match 'HELLO WORLD'
)        End the capturing group

使用.group()例如访问组中捕获的内容

import re
regex = re.compile(r"(?s)(Te pri.*?)HELLO WORLD")
m = regex.match(your_text)
m.group(1)

快乐的编码！你知道吗

网友

3楼 · 编辑于 2024-04-28 22:47:06

使用以下内容：你知道吗

import re

text = '''Lorem ipsum dolor sit amet, timeam evertitur ex eos, utamur temporibus disputationi eum te. 
Te pri dicant exerci nonumy, in case erat albucius mei.  
Pertinax periculis concludaturque eum te, et nam vero nominavi deterruisset. HELLO WORLD. 
Ex augue scriptorem pri. Vocent minimum quaerendum duo eu, habemus adipiscing ex eu'''


try:
    foundSubString = re.search('(?s)(Te\spri\sdicant.*?)HELLO WORLD', text).group(1)
except AttributeError:
    foundSubString = '' # apply your error handling

print 'Match Found:',foundSubString

相关问题更多 >

编程相关推荐

热门问题

热门文章