会话和文本摘要等模块

readless的Python项目详细描述


用于对话和文本摘要等的python模块 令人兴奋的特点。

features由本模块提供:

  • 文本分段使用:
    • texttilingblock score
    • texttilingvocabulary简介
  • 会话摘要使用:
    • 簇秩
  • 文本摘要使用:
    • textrank
    • 随机

安装

确保有Python2.7/3.3+和pipWindowsLinux) 安装。简单运行(首选方式):

$ [sudo] pip install readless

或者对于开发中的最新版本:

$ [sudo] pip install git+git://github.com/adichat/read-less.git

无读api

您可以像在项目中使用库一样使用readless。

使用ClusterRank算法快速总结对话:

# -*- coding: utf8 -*-fromreadless.Summarizationimportclusterranksummarizer=clusterrank.ClusterRank()pathToFile="C:/conversation.in"summary=summarizer.summarizeFile(pathToFile)

用于使用文本平铺算法分割文本:

# -*- coding: utf8 -*-fromreadless.Segmentationimporttexttilingsegmentation=texttiling.TextTiling()pathToFile="C:/conversation.in"segmentedText=segmentation.segmentFile(pathToFile)

有关其他api功能的详细列表,请参见**ReadLess Documentation**

贡献

欢迎所有捐款。这个模块正在开发中 是几个改进的范围。测试将与 其他支持网页的摘要算法 总结。有关即将推出的功能,请参见Future developments

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
单击搜索按钮后,不会填充java JList   JavaSpring请求映射antmatcher忽略URL   国际化为什么java语言环境是最终的?   java文本区域的swing错误   docker FnProject java函数,其依赖项托管在私有存储库中   使用Java/Scala标记为HTML   多线程中的Java调用子类方法   java在查找字符串中第一个非重复字符时计算字符值   java在spring安全性中autoconfig=true有什么用途   如何为Kotlin扩展函数的接收者添加KDoc注释(Java中的第一个参数,`this`在Kotlin中)   java注释节点JaxB编组   java我一直得到这个异常错误空指针异常我如何停止这个错误并得到一个工作错误   Java中的python乘法字符串   用java将英语翻译成本地语言   java如何构建自己的传输级协议?   Java全局变量之类的