如何用这种方式为拆分字符串编写Python正则表达式

2024-04-20 04:43:09 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个字符串,格式如下:

CA 'xxxxxx'
string
string
string
string
CA 'xxxxxx'
string
string
string
string
CA 'xxxxx'
string
string
string
string

这基本上是一个刺痛,在每个段落之间的词CA和'xxxxx',其中每个x可以代表一个字母的数字。(不是x!)你知道吗

例如:

CA 'mmaa22'

我怎样才能写一个正则表达式,这样就可以用CA'xxxxxx'来拆分字符串? 注意:CA“xxxxxx”之间的每个段落的行数不同。视情况而定。你知道吗

谢谢你


Tags: 字符串string格式字母情况代表数字ca
2条回答

我希望这能解决你的问题。你知道吗

import re

toSplit = """CA 'xxxxxx'
string
string
string
string
CA 'xxxxxx'
string
string
string
string
CA 'xxxxx'
string
string
string
string
"""
pattern = r"CA.*'"

print(re.split(pattern, toSplit))

可以使用regex按r"CA '\w*'"拆分。你知道吗

import re

re.split(r"CA '\w*'", lines)
# where lines is your input string

如果您的输入linesCA 'xxxx'开始/结束,您将得到一个空字符串,上面的代码可以通过以下方式过滤掉:

list(filter(lambda x: x != '', re.split(r"CA '\w*'", lines)))

相关问题 更多 >