这里是一个电子邮件的示例,我想解析它,只提取它的正文。在
RECEIVED: 2012-11 20 09:59:24
SUBJECT: Get Boddy
--- Original Sender: Mark Twain. ---
----- Original Message -----
From: Boby Indo
To: Obum Hunter
At: 11/20 9:59:22
***NEW ISSUE SUPPORTED THROUGH UNIVERSALITY vs 104-13 on AY 3s JAN
10+BB {MYXV ABC 4116 SM MYXV YA 102-15 <DO>} | 2010/11 4.0s 4.0s
6+ BB {MYXV ABC 4132 NS MYXV YT 102-22 <DO>} | 2010 4.5s 4.5s
ABO 2006-OP1 M1 00442PAG5 19-24 p5
***SECOND SUPPORTED TRHOUGH INVERSALITY GEVINGS
10+BB {NXTW VXA 4061 SL MYXV YA 103-22 <DO>} | 11 wala 3.5s 3.5s
10+BB {NXTW VXA 12-47 SP MYXV YA 106-20 <DO>} | 22 wala 4.0s 4.0s
------------------------------------------------------------
© Copyright 2012 The Ridgly Group, Inc. All rights reserved. See
http://www.examply.html for important information disclosure.
我的期望是:
^{pr2}$如果***
行也能被消除,那就太好了。在
这是我到目前为止得到的结果(?P<header>[\S+\s]+At:.*)\n+(?P<body>[\S+\s]([\d\.\d]+[a-z]?$))
。这似乎做得不好,因为它在最后4.0秒后抓取了短划线,并在非ascii字符©
处卡住了。谢谢!在
PS:我认为最好的方法是切断邮件的邮件头和邮件尾。剩下的就是尸体了。因为邮件的头和尾总是保持不变,但是邮件的正文会在不同的电子邮件中发生变化。解决方案不必针对电子邮件。在
看看这对您是否有效,您需要的行以数字开头,后跟加号:
这将与预期输出相匹配:
^{pr2}$更新以满足新要求:
更新以提取电子邮件的整个正文:
相关问题 更多 >
编程相关推荐