英语多任务cnn培训的ontonnotes。分配上下文特定的令牌向量、pos标记、依赖解析和命名实体。

en-qai-sm的Python项目详细描述


library.qai.spacy

定制Spacy管道

安装

可在PyPi

$ pip install en-qai-sm
> installs the package and deps including spacy

用法

importspacynlp=spacy.load('en_qai_sm')>>>doc=nlp("I ain't got no hands!")>>>fortokenindoc:print(token,token.pos_)...IPRONain't VERBgotVERBnoDEThandsNOUN!PUNCT

关于Spacy管道

默认Spacy管道包含4个步骤(组件):

spaCy pipeline

  • tokenizer-将文本拆分为标记
  • tagger-分配部分语音标记
  • parser-分配依赖项标签
  • ner-检测并标记命名实体

自定义组件(例如,doc上的任何函数)可以插入到管道中(在tokenizer之后的任何位置)。为了简单起见,tokenizer不在管道描述中列出。

引用:spaCy docs

管道组件

v1.0.0

管道包括:

pipeline=["merge_matcher","tagger","parser","ner"]

其中merge_matcher匹配并合并为类型为:

  • 用连字符连接,例如rock-hard
  • 收缩例如don't
  • 特殊(非正式)缩写,例如gonna

许可证

因为这只是Spacy的en_core_web_sm的一个小扩展,所以我们包含相同的许可证-mit。

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java Admob初始化失败,应用程序在启动时崩溃,即使没有错误   java如何在ibatis中使用存储过程?   java干净体系结构:在不同的环境中分离IO和核心。jar文件   Java streams compare属性在两个列表之间相等,并返回true或false   有没有一种压缩Java Try-Catch块的方法?   Android片段中的java Mapbox SDK   用于IzPack安装的JavaFX本机启动器:控制InnoSetup/WiX/RPMBuild行为   java接口是否可以将一个已经实例化的对象作为属性?   hashmap中的java线程问题   请求中的java字符编码。getRemoteUser()   java将OneTONE链接更改为另一个id为的实体   java当使用javaw启动应用程序时,不会执行关闭钩子。exe   Android java代码更改显示的微调器   java GZIP解压字符串和字节转换   运行springbatch后java LDAP运行状况检查失败