会话和文本摘要等模块

heidi的Python项目详细描述


用于对话和文本摘要等的python模块 令人兴奋的特点。

features由本模块提供:

  • 文本分段使用:
    • texttilingblock score
    • texttilingvocabulary简介
  • 会话摘要使用:
    • 簇秩
  • 文本摘要使用:
    • textrank
    • 随机

安装

确保有Python2.7/3.3+和pipWindowsLinux) 安装。简单运行(首选方式):

$ [sudo] pip install readless

或者对于开发中的最新版本:

$ [sudo] pip install git+git://github.com/adichat/read-less.git

无读api

您可以像在项目中使用库一样使用readless。

使用ClusterRank算法快速总结对话:

# -*- coding: utf8 -*-fromreadless.Summarizationimportclusterranksummarizer=clusterrank.ClusterRank()pathToFile="C:/conversation.in"summary=summarizer.summarizeFile(pathToFile)

用于使用文本平铺算法分割文本:

# -*- coding: utf8 -*-fromreadless.Segmentationimporttexttilingsegmentation=texttiling.TextTiling()pathToFile="C:/conversation.in"segmentedText=segmentation.segmentFile(pathToFile)

有关其他api功能的详细列表,请参见**ReadLess Documentation**

贡献

欢迎所有捐款。这个模块正在开发中 是几个改进的范围。测试将与 其他支持网页的摘要算法 总结。有关即将推出的功能,请参见Future developments

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java获取骆驼路由交换正文()中的无效字符   java如何在Android中创建多语言枚举?   java如何将多个ArrayList<Hashmap>值组合到一个ListView中   后缀运算符Java后增量和预增量行为   SQlite在java中更新列号   Mac OS Yosemite上的java No JRE 1.8虚拟机   java swing在Jlabel中遇到问题   JAVAutil。scanner小java程序打印不可见的换行符?   java从原点到点的路径数   java重写Excel列而不是创建新列   将一行从SQL数据映射到Java对象   spring Application Insights Java SDK+代理不能很好地协同工作   java排序字符串列表?不使用长度函数查找列表的长度   java使用stream collect返回相同的列表,对重复项进行剪切和求和,抛出一个非静态引用   将字母字符与前面没有百分号的Java正则表达式匹配