关于如何在s中找到所需的所有格式

>>> re.findall(r'\[.*?\]',s) ['[aaa]', '[bbb]', '[ccc]'] >>> re.split(r'\[.*?\]',s) ['', 'foo', 'bar', 'foobar'] >>> for t in zip(re.findall(r'\[.*?\]',s),[e for e in re.split(r'\[.*?\]',s) if e]): ... print(''.join(t)) ... [aaa]foo [bbb]bar [ccc]foobar

3条回答

网友

1楼 · 编辑于 2024-05-19 23:02:45

方法之一：

import re

s = '[aaa]foo[bbb]bar[ccc]foobar'
result = re.findall(r'\[[^]]+\][^\[\]]+', s)

print(result)

输出：

['[aaa]foo', '[bbb]bar', '[ccc]foobar']

\[或\]-按字面意思匹配括号
[^]]+-匹配除]之外的一个或多个字符
[^\[\]]+-匹配除括号\[\]以外的任何字符

网友

2楼 · 编辑于 2024-05-19 23:02:45

我认为这可以奏效：

r'\[.+?\]\w+'

网友

3楼 · 编辑于 2024-05-19 23:02:45

我认为如果输入字符串格式“足够严格”，就可以尝试不带regexp的东西。这看起来可能是一个微观优化，但可能是一个有趣的挑战。你知道吗

result = map(lambda x: '[' + x, s[1:].split("["))

所以我试着在1英里迭代中检查性能，下面是我的结果（秒）：

result = map(lambda x: '[' + x, s[1:].split("[")) # 0.89862203598
result = re.findall(r'\[[^]]+\][^\[\]]+', s) # 1.48306798935
result = re.findall(r'\[.+?\]\w+', s) # 1.47224497795
result = re.findall(r'(\[\w*\]\w+)', s) # 1.47370815277

相关问题更多 >

编程相关推荐

热门问题

热门文章

关于如何在s中找到所需的所有格式

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >