用于提取消息引用和签名的库。

claw的Python项目详细描述


https://circleci.com/gh/tictail/claw.svg?style=svg

claw,https://github.com/tictail/claw是一个提取消息引用和签名的库。 它是原始https://github.com/mailgun/talon库的更轻量级版本。

Changelog

如果您曾经试图解析消息引用或签名,您就会知道,在此区域中缺少任何格式标准可能会使此任务成为一场噩梦。 希望这个图书馆能让你的生活更轻松。

安装

pip install claw

用法

下面是如何初始化库并从文本中提取回复的 消息:

importclawfromclawimportquotationsclaw.init()text="""Reply

-----Original Message-----

Quote"""reply=quotations.extract_from(text,'text/plain')reply=quotations.extract_from_plain(text)# reply == "Reply"

从html中提取回复:

html="""Reply
<blockquote>

  <div>
    On 11-Apr-2011, at 6:54 PM, Bob &lt;bob@example.com&gt; wrote:
  </div>

  <div>
    Quote
  </div>

</blockquote>"""reply=quotations.extract_from(html,'text/html')reply=quotations.extract_from_html(html)# reply == "<html><body><p>Reply</p></body></html>"

通常最好的方法是最简单的。以下是如何提取 来自电子邮件的签名,无任何 机器学习花哨的东西:

fromclaw.signatureimportextract_signaturemessage="""Wow. Awesome!
--
Bob Smith"""text,signature=extract_signature(message)# text == "Wow. Awesome!"# signature == "--\nBob Smith"

动作快,90%的时间都很有魅力。其他10%你可以用 机器学习算法的威力。请参阅原始的talon实现。

开发

virtualenv venv
source venv/bin/activate

make install

make test

发布新版本:

在setup.py和update changelog.md中提升版本,然后:

make release

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java MySQL准备的语句未从JavaFX文本字段读取   java在Karaf的OSGi包中使用jboss resteasy(客户端)   Diamond不编译Java 7   Java中的超类和子类   使用PL/Java和JPA或其他持久性库的postgresql   java由于大写而导致“无法识别的字段”   javascript客户端未接收来自Servlet的响应   java如何保持从url下载到imageview的图像的质量,并将其裁剪成圆形?   java如何在EditText更改时从ArrayAdapter中删除项?   java我应该怎么做?我不能使用jUnit等   java在int[]b;中查找对;?   java为什么我的HBase启动后没有任何日志?   java无法在发布模式下启动活动(使用proguard安卓optimize配置)   java在绘制绘图线后取消选择绘图线   java Android和Robotium编写自动化测试?