在电子邮件正文中搜索字符串并在该字符串之后返回值在模式之后返回行

#!/usr/bin/python import email, imaplib, re user = 'user@example.com' pwd = 'pass' conn = imaplib.IMAP4_SSL("outlook.office365.com") conn.login(user,pwd) conn.select("Inbox") resp, items = conn.uid("search",None, 'All') items = items[0].split() for emailid in items: resp, data = conn.uid("fetch",emailid, "(RFC822)") if resp == 'OK': email_body = data[0][1].decode('utf-8') mail = email.message_from_string(email_body) if mail["Subject"].find("PA1") > 0 or mail["Subject"].find("PA2") > 0: match=re.findall(r'Event demon log entry.*\n.*\n.*', email_body , re.IGNORECASE) print match

[u'Event demon log entry:\r\n\r\n[27/12/2018 08:15:02] CAUAJM_I_40245 EVENT: ALARM ALARM: MAXRUNALARM JOB: p=\r', u'Event demon log entry:<br><br=\r\n>[27/12/2018 08:15:02] CAUAJM_I_40245 EVENT: ALARM ALARM: M=\r\nAXRUNALARM JOB: p1_credit_qv_curve_snap MACHINE: p1prog06<br><br>Attac=\r']

1条回答

网友

1楼 · 发布于 2024-06-12 07:52:57

您可以使用两个捕获组：

(\bEvent demon log entry:)(?:\r?\n|\r)+(\[[^]]+\].*)

参见regex demo Python demo

将匹配：

(\bEvent demon log entry:)在第一组中捕获
(?:\r?\n|\r)+匹配1+次新行（或者使用{2}而不是+精确匹配2次）
(\[[^]]+\].*)匹配[，然后不是一个]，使用一个取反的字符类，然后匹配一个结束语]。然后匹配0+次除新行以外的任何字符

例如，使用findall：

import re
regex = r"(\bEvent demon log entry:)(?:\r?\n|\r)+(\[[^]]+\].*)"
email_body = ("Event demon log entry:\n\n"
            "[27/12/2018 08:15:02] CAUAJM_I_40245 EVENT: ALARM ALARM: MAXRUNALARM JOB: p1_credit_qv_curve_snap MACHINE: p1prog06")

for (g1, g2) in re.findall(regex, email_body , re.IGNORECASE):
    print(g1 + g2)

相关问题更多 >

编程相关推荐

热门问题

热门文章