在Python中用正则表达式识别和捕获文本时遇到问题

text = 'gon.urls={stringstuffhere};gon.pageview={morstrings};gon.pore{stringstuffhere}; gon.capture={allyourstrings}; gon.perks={stringshere};gon.base={stringsbelongtous};gon.campaign={evenmorestrings};gon.haha={somanystrings}; gon.tabs=[{morestrings}{morestrings}{more strings}]; gon.main={mainstringsturnon};gon.currency={strings}; gon.locale="en";gon.default_later="somestrings"'

[('urls', 'stringstuffhere'), ('pore', 'stringstuffhere'), ('tabs', '{morestrings}{morestrings}{more strings}'), ('campaign', 'evenmorestrings'), ('perks', 'stringshere'), ('currency', 'strings'), ('pore', 'stringstuffhere')] #locale group missing

r'(?<=gon\.)(perks|currency|campaign|tabs|pore|urls|locale)\[?{?\"?(.+?)\"?}?\]?;(?=g)|on\.(locale)=(\"\w+\");', html) r'gon.(perks|currency|campaign|tabs|pore|urls|locale)=\[?\{?(.*?\"?)\}?\]?;(?=gon)'

1条回答

网友

1楼 · 发布于 2024-06-16 16:06:34

也许吧

gon\.(perks|currency|campaign|tabs|trust_passport|urls|locale)=\[?{?"?(.*?)"?}?\]?;|gon\.pore{([^}]+)}

或者

gon\.(perks|currency|campaign|tabs|trust_passport|urls|locale|pore)=?\[?{?"?(.*?)"?}?\]?;

在这里工作还可以

Demo

测试1

import re

string = '''
gon.urls={stringstuffhere};gon.pageview={morstrings};gon.pore{stringstuffhere};
gon.capture={allyourstrings};
    gon.perks={stringshere};gon.base={stringsbelongtous};gon.campaign={evenmorestrings};gon.haha={somanystrings};
        gon.tabs=[{morestrings}{morestrings}{more strings}];
            gon.main={mainstringsturnon};gon.currency={strings};gon.bub={someonesetusup};
    gon.locale="en";gon.default_later="somestrings
'''

expression = r'(?m)gon\.(perks|currency|campaign|tabs|trust_passport|urls|locale)=\[?{?"?(.*?)"?}?\]?;|gon\.pore{([^}]+)}'


print(re.findall(expression, string))

输出1

[('urls', 'stringstuffhere', ''), ('', '', 'stringstuffhere'), ('perks', 'stringshere', ''), ('campaign', 'evenmorestrings', ''), ('tabs', 'morestrings}{morestrings}{more strings', ''), ('currency', 'strings', ''), ('locale', 'en', '')]

测试2

import re

string = '''
gon.urls={stringstuffhere};gon.pageview={morstrings};gon.pore{stringstuffhere};
gon.capture={allyourstrings};
    gon.perks={stringshere};gon.base={stringsbelongtous};gon.campaign={evenmorestrings};gon.haha={somanystrings};
        gon.tabs=[{morestrings}{morestrings}{more strings}];
            gon.main={mainstringsturnon};gon.currency={strings};gon.bub={someonesetusup};
    gon.locale="en";gon.default_later="somestrings
'''

expression = r'(?m)gon\.(perks|currency|campaign|tabs|trust_passport|urls|locale|pore)=?\[?{?"?(.*?)"?}?\]?;'


print(re.findall(expression, string))

输出2

[('urls', 'stringstuffhere'), ('pore', 'stringstuffhere'), ('perks', 'stringshere'), ('campaign', 'evenmorestrings'), ('tabs', 'morestrings}{morestrings}{more strings'), ('currency', 'strings'), ('locale', 'en')]

如果您希望简化/修改/探索表达式，在regex101.com的右上面板中已经解释过了。如果您愿意，还可以在this link中查看它如何与一些示例输入匹配

正则表达式电路

jex.im可视化正则表达式：

Demo

测试1

输出1

测试2

输出2

正则表达式电路

相关问题更多 >

编程相关推荐

热门问题

热门文章