需要Python正则表达式帮助吗

2条回答

网友

1楼 · 编辑于 2024-05-23 18:25:08

对。你是对的。只需从原始文本中删除空白和新行。例如：

link = re.findall("CONFIRM<([^\s]+)>", raw_email.replace('\n', '').replace(' ', ''))

网友

2楼 · 编辑于 2024-05-23 18:25:08

基本上，您希望获得CONFIRM<和>之间的所有内容

通过将原始url中的空格替换为空字符串来删除这些空格
(.*?)将捕获CONFIRM<和>之间的所有内容
使用.group(1)获取实际捕获的字符串

import re
def get_url(raw):
    raw = raw.replace(' ', '')
    url = re.search('CONFIRM<(.*?)>', raw).group(1)
    return url

对于给定的测试用例

raw_url = 'Please click "CONFIRM" below. CONFIRM<https://app.rule.io/subscriber/optIn?token=3DeyJ0eXAiOiJKV1QiLCJhbG= ciOiJIUzI1NiJ9.eyJzdWIiOjEssswrgTA3OCwic3Vic2NyaWJlckZvcm0iOjExOTAsImlzcyI6= Imh0dHBzOi8vYawetgg1bGUuaW8iLCJpYXQiOjE2MjM1NzkwMDYsImV4cCI6MTYyNDE4MzgwNiw= ibmJmIjoxNjIzNTc5MDA2LCJqdGkiOiJEbHMyeDJmcG5pZEhTWXVjwjwje-52uhXlj9efaEwzfI= Rruoiqc3RvUTZ8LgB6ALEAoL4>'
print(get_url(raw_url))

将输出

https://app.rule.io/subscriber/optIn?token=3DeyJ0eXAiOiJKV1QiLCJhbG=ciOiJIUzI1NiJ9.eyJzdWIiOjEssswrgTA3OCwic3Vic2NyaWJlckZvcm0iOjExOTAsImlzcyI6=Imh0dHBzOi8vYawetgg1bGUuaW8iLCJpYXQiOjE2MjM1NzkwMDYsImV4cCI6MTYyNDE4MzgwNiw=ibmJmIjoxNjIzNTc5MDA2LCJqdGkiOiJEbHMyeDJmcG5pZEhTWXVjwjwje-52uhXlj9efaEwzfI=Rruoiqc3RvUTZ8LgB6ALEAoL4

相关问题更多 >

编程相关推荐

热门问题

热门文章

需要Python正则表达式帮助吗

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >