用于提取消息引用和签名的库。
claw的Python项目详细描述
claw,https://github.com/tictail/claw是一个提取消息引用和签名的库。 它是原始https://github.com/mailgun/talon库的更轻量级版本。
如果您曾经试图解析消息引用或签名,您就会知道,在此区域中缺少任何格式标准可能会使此任务成为一场噩梦。 希望这个图书馆能让你的生活更轻松。
安装
pip install claw
用法
下面是如何初始化库并从文本中提取回复的 消息:
importclawfromclawimportquotationsclaw.init()text="""Reply -----Original Message----- Quote"""reply=quotations.extract_from(text,'text/plain')reply=quotations.extract_from_plain(text)# reply == "Reply"
从html中提取回复:
html="""Reply <blockquote> <div> On 11-Apr-2011, at 6:54 PM, Bob <bob@example.com> wrote: </div> <div> Quote </div> </blockquote>"""reply=quotations.extract_from(html,'text/html')reply=quotations.extract_from_html(html)# reply == "<html><body><p>Reply</p></body></html>"
通常最好的方法是最简单的。以下是如何提取 来自电子邮件的签名,无任何 机器学习花哨的东西:
fromclaw.signatureimportextract_signaturemessage="""Wow. Awesome! -- Bob Smith"""text,signature=extract_signature(message)# text == "Wow. Awesome!"# signature == "--\nBob Smith"
动作快,90%的时间都很有魅力。其他10%你可以用 机器学习算法的威力。请参阅原始的talon实现。
开发
virtualenv venv source venv/bin/activate make install make test
发布新版本:
在setup.py和update changelog.md中提升版本,然后:
make release