我有一段文字看起来是这样的:
TTL1 | TTL2 | TTL3
some text in a line1
some text in a line2
some text in a line3
TTL1 | TTL2 |
TTL3
some text in a line1
some text in a line2
some text in a line3
some text in a line4
some text in a line5
TTL1 | TTL2 | TTL3
some text in a line1
some text in a line2
some text in a line3
some text in a line4
...
解释:我有标题行,有时可以分成多行,然后我有很多其他行。 我想捕获所有标题(即使它们在不同的行中),并在一个组中捕获标题后面的所有行。你知道吗
我有truoble与多行标题和多行内容,我不知道如何提取它与regex和python。你知道吗
有什么想法吗?你知道吗
你可以试试这个:
根据op的评论,奇怪的是,行中可能包含|,这使得很难区分标题和行,因此可以尝试以下解决方案:
Updated Regex Explanation
Explanation
示例代码:
Run it here
样本输出:
对
re.findall()
函数使用以下方法:输出:
相关问题 更多 >
编程相关推荐