Python正则表达式，用于标识字符串中的括号对；除非括号在方括号内？

[object]-ABGF-[A-BEC(2)]-LRPG-[object] ABCDEFGHDGSASDASR-(typ1)-ASDHASDUASIUDHAS-[object] [object]-RLC(1)-C(2)-GF-[obj]-KSASDASD-[obj3]-ASD-[object] [object3]-RLC(1)-C(2)-GF-[Hyp]-KSCRSRQCK-[Hyp]-HRCC-[amide] ABCDEFGHIJK(1)-GHGSHS(2)-ABCDE ABCDD(1)-ASDASDASD(1)-ASBFIFD ASDASDASD(1)-ASDASADJASJS(2)-ERASDASD

circle_pattern = re.compile(r'\(([a-z0-9]+)\)') if circle_regex: x_list = ["(" + re.sub("\d", "x", i) + ")" for i in circle_regex] check_if_even = dict(Counter(circle_regex)) for k,v in check_if_even.items(): if v % 2 != 0: print(row)

1条回答

网友

1楼 · 发布于 2024-04-28 21:13:23

您可以使用2个负lookahead来排除不应该匹配的内容

^(?!.*?\[[^][()]*\([^()]*\))(?!.*?\((\d+)\).*?\1).+

模式匹配

^字符串的开头
(?!负前瞻
- .*?\[[^][()]*\([^()]*\)匹配[]之间的{}
)关闭前瞻
(?!负前瞻
- .*?\((\d+)\).*?\1在括号之间匹配相同数字的2倍
)关闭前瞻
.+匹配任何字符的1+倍

Regex demo Python demo

范例

import re

regex = r"^(?!.*?\[[^][()]*\([^()]*\))(?!.*?\((\d+)\).*?\1).+"

s = ("[object]-ABGF-[A-BEC(2)]-LRPG-[object]\n"
    "ABCDEFGHDGSASDASR-(typ1)-ASDHASDUASIUDHAS-[object]\n"
    "[object]-RLC(1)-C(2)-GF-[obj]-KSASDASD-[obj3]-ASD-[object]\n"
    "[object3]-RLC(1)-C(2)-GF-[Hyp]-KSCRSRQCK-[Hyp]-HRCC-[amide]\n"
    "ABCDEFGHIJK(1)-GHGSHS(2)-ABCDE\n"
    "ABCDD(1)-ASDASDASD(1)-ASBFIFD\n"
    "ASDASDASD(1)-ASDASADJASJS(2)-ERASDASD")

matches = re.finditer(regex, s, re.MULTILINE)
for matchNum, match in enumerate(matches, start=1):
    print (match.group())

输出

ABCDEFGHDGSASDASR-(typ1)-ASDHASDUASIUDHAS-[object]
[object]-RLC(1)-C(2)-GF-[obj]-KSASDASD-[obj3]-ASD-[object]
[object3]-RLC(1)-C(2)-GF-[Hyp]-KSCRSRQCK-[Hyp]-HRCC-[amide]
ABCDEFGHIJK(1)-GHGSHS(2)-ABCDE
ASDASDASD(1)-ASDASADJASJS(2)-ERASDASD

相关问题更多 >

编程相关推荐

热门问题

热门文章