获取Python中某个符号后的段落

import re article_content = [open('text.txt').read() ] after_asterisk_article_paragraph = [] string = "****" after_asterisk_article_paragraph = string[string.find("****")+4:] print(*after_asterisk_article_paragraph, sep='\n\n')

1条回答

网友
1楼 · 发布于 2024-05-31 23:24:57

您可以读取整个文件，并使用一个模式来匹配至少4倍的asterix，然后是所有非空行或以4倍asterix开头的行
^\*{4,}((?:\r?\n(?!\s*$|\*{4}).+)*)
^\*{4,}从字符串开始匹配4次或更多次*
(捕获组1
(?:非捕获组
\r?\n匹配换行符
(?!\s*$|\*{4}).+如果整行不是空的，或者以4次开始*使用负前瞻(?!匹配整行
)*可选地重复该组
)关闭捕获组1
Regex demo
例如，使用re.findall返回捕获组1的值：
import re file = open('text.txt', mode='r') result = [s.strip() for s in re.findall(r'^\*{4,}((?:\r?\n(?!\s*$|\*{4}).+)*)', file.read(), re.MULTILINE)] print(result) file.close()
输出
['Sed id placerat magna.', 'Pellentesque in ex ac urna tincidunt tristique.']

相关问题更多 >

编程相关推荐

热门问题

热门文章