在Python中解析电子邮件内容

2021-05-16 09:00:28 发布

您现在位置:Python中文网/ 问答频道 /正文

我每天都会收到一封电子邮件,里面有我写的一些时事通讯的说明。我想解析电子邮件的内容,提取有用的部分并将它们存储在元组中。在

以下是电子邮件内容的示例:


“没有有用信息的开场白。在

(XXX 1-111)

http://the_link_for_the_resource.com

(YYY 2-222)

http://the_link_for_the_second_resource.com

。。。在

又一个无用的句子”


在本例中,“XXX”=邮件列表,“1-111”=段

我希望信息存储在元组中(邮件列表、段、url)

最好的办法是什么?在

编辑:

在编写从服务器检索消息的内容之前,我想确定解析消息的确切内容是否可行。所以为了开始黑客攻击,我用电子邮件模块和电子邮件文件写了一个快速脚本。代码如下:


mail_file=open(“新主板_邮件.eml“,”r“
邮件消息=从_文件发送email.message_(邮件文件)
有效载荷=邮件_message.get_有效负载(解码=真)
charset=邮件_message.get_content_字符集('iso-8859-1')
邮件内容=有效载荷.解码(字符集)

我的理解是,这段代码导致“mail_content”包含邮件内容的Unicode字符串。我将如何从这里开始解析内容? 在