将文本语料库转换为一组关系事实。

rnlp的Python项目详细描述


Python Package Index (PyPi) latest version.License.Master branch build status.Master branch code coverage.Documentation build status and link to documentation.

关系nlp预处理(rnlp):一个python包和工具,用于将文本转换为一组关系事实。

安装

基于PyPi的稳定构建

pip install rnlp

快速启动

rnlp既可以用作命令行界面(CLI)工具,也可以用作导入的Python包

CLIImported
^{pr 2}$ ^{pr 3}$

rnlp创建的关系包括以下内容:

  • 语句在块中的相对位置:
    • earlySentenceInBlock:语句出现在块的前三分之一内
    • midWaySentenceInBlock:语句出现在块长度的前三分之一和后三分之一之间
    • lateSentenceInBlock:语句出现在块长度的最后三分之一内。
  • 单词在句子中的相对位置:
    • earlyWordInSentence:单词出现在句子的前三分之一内
    • midWayWordInSentence:单词出现在句子的三分之一到三分之二之间。
    • lateWordInSentence:单词出现在句子的最后三分之一内。
  • 项目之间的相对位置:
    • nextWordInSentence:从一个单词指向其邻居的指针
    • nextSentenceInBlock:从一个句子指向它的邻居的指针。
  • 存在论语义学:
    • sentenceInBlock:语句出现在特定块中
    • wordInSentence:单词出现在特定的句子中
  • 关于单词的低级信息:
    • wordString:单词的字符串表示形式。
    • partOfSpeechTag:单词的词性(由nltk词性标记器确定)。

-

文件包含一个玩具语料库(example files/)和一个boostsrl树的图像,用于预测句子中的单词是否是单词“you”。

https://raw.githubusercontent.com/hayesall/rnlp/master/documentation/img/output.png

树上说,如果单词“b”中包含的字符串是“you”,那么“b”就是“you”,概率很高。(这当然是真的)。 一个更有趣的推论是错误的分支,它说如果单词“b”是句子“A”中的早期单词,单词“anon1235”也是句子“A”中的早期单词,如果单词“anon1235”中包含的单词字符串是“谢谢”,那么单词“b”有相当的机会成为单词“you”(模型能够得知,当“谢谢”出现在同一句话的开头时,“你”一词经常与“谢谢”一词出现在同一句话中)。

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
Android Studio中的Java错误,但不是Eclipse   java如何使用jsp更新数据库中的文件?   jsoup如何在java中从较大的子字符串中提取多个子字符串?   java RestFB:当页面的URI具有页面名称时,无法获取页面帖子   java可以让Maven做我们在ANT构建中正在做的事情。xml   java如何在JasperReports中动态包含来自Servlet的图像?   java在hibernate中用新集更新旧集   从导出为可运行的Java应用程序创建、解析和管理XML文件。jar文件   在Java中使用数组的基础知识   调试从JAVA程序调用的MATLAB函数   java实现了Iterable hands错误大小的备份   JAVA木卫一。FileNotFoundException:请求的资源不可用   java Android Spring 1.0.1使用基本身份验证删除   java如何使用com解析和对象在一个数字数组中的值。fasterxml。杰克逊。数据绑定。对象映射器   比较两个字符串时发生java NullPointerException