python spacy json-nlp包

spacyjsonnlp的Python项目详细描述


Spacy到JSON-NLP

(c)2019年,Damir CavarOren Baldinger,Maanvitha Gongalla,Anurag Kumar,Murali Kammili

NLP-Lab.org带给你的!

这只适用于Spacy2.1.0!

我也有同样的问题。我把Spacy从2.1.4降到2.1.0,Numpy降到1.14.5来解决这个问题。

简介

目前这个模块需要Python3.6+。

此模块为JSON-NLP提供spaCyv2.1包装。它接受spaCy输出并生成JSON-NLP输出。它还提供了一个微服务包装器,允许您使用Flask或其他基于wsgi的服务器将spaCy模块作为持久restful服务启动。

由于此微服务构建在spaCy上,因此需要下载其模型,例如:

python -m spacy download en
python -m spacy download en_core_web_md

其他管道模块

spaCy允许添加其他模型作为管道模块。我们为共指树和短语结构树提供了这样的集成。

回指和共指消解

我们提供HuggingFace共指解析,一个紧密集成到spaCy中的快速系统。注意,第一次运行解析器时,如果coreference模型不存在,它将下载它们。这些模型只适用于英语。

短语结构树(选区解析)

我们提供了benepar解析器的cpu版本,这是一个非常精确的短语结构解析器。请记住,它是TensorFlow模块,因此具有显著的启动时间和相对较高的内存需求(4GB+)。

如果您有可用的GPU,可以使用以下命令安装模块的GPU版本:

pip install --upgrade benepar[gpu] 

微服务

JSON-NLP存储库提供了一个microservice类,带有一个预构建的Flask实现。要运行它,请执行:

python spacyjsonnlp/server.py

由于server.py扩展了Flask应用程序,wsgi文件将包含:

from spacyjsonnlp.server import app as application

要禁用管道组件(如短语结构解析),请添加

application.constituents = False

可以禁用或启用的属性的完整列表是

  • 成分
  • 依赖关系
  • 共指
  • 表达式

微服务公开以下uri:

  • /成分
  • /依赖关系
  • /共指
  • /表达式
  • /令牌列表

这些uri是禁用解析的其他组件的快捷方式。在所有情况下,tokenList都将包含在JSON-NLP输出中。一个示例url是:

http://localhost:5000/dependencies?text=I am a sentence

文本通过GETPOST参数提供给微服务。如果您将url作为参数传递,那么microservice将删除该url并处理网站的文本。

使用spacy_model参数可以选择用于解析的spaCy语言模型。

下面是一个示例GET调用:

http://localhost:5000?spacy_model=en&constituents=0&text=I am a sentence.

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java允许具有不同父类的类扩展类,而无需多重继承   java如何创建动态化的JScrollPane w/JPanel作为客户端?   java如何组织和命名包   在Java中读取属性文件   java无法解释的Android意图行为   在Java中动态执行多个BPEL文件的部署   ssl Java 6 SNI(服务器名称指示)?   java我们可以使用Robot框架自动化web和移动应用程序来执行并行执行   java for star pettern的循环   java为什么BinaryReader在线程中,从netty读取错误的数据包?   在java中将华氏度转换为摄氏度   使用Spark和java处理空值和引号编写CSV文件   Java中已排序日期到块的列表   visual studio代码VSCode Java不是linting或自动完成局部变量,而是自动完成Java快捷方式,如“sysout”