Python字符串模式识别/压缩

2024-06-09 23:18:13 发布

您现在位置:Python中文网/ 问答频道 /正文

我可以做基本的正则表达式好,但这是略有不同,即我不知道什么模式将是。

例如,我有一个类似字符串的列表:

lst = ['asometxt0moretxt', 'bsometxt1moretxt', 'aasometxt10moretxt', 'zzsometxt999moretxt']

在本例中,公共模式是两段公共文本:'sometxt''moretxt',开始并由长度可变的其他内容分隔。

普通字符串和变量字符串当然可以出现在任何顺序和任何场合。

有什么好的方法可以将字符串列表压缩成它们共同的部分和单独的变体?

示例输出可能是:

c = ['sometxt', 'moretxt']

v = [('a','0'), ('b','1'), ('aa','10'), ('zz','999')]

Tags: 字符串文本内容列表顺序模式lst场合