invenio模块与grobid api交互以提取元数据。

invenio-grobid的Python项目详细描述


https://img.shields.io/travis/inspirehep/invenio-grobid.svghttps://img.shields.io/coveralls/inspirehep/invenio-grobid.svghttps://img.shields.io/github/tag/inspirehep/invenio-grobid.svghttps://img.shields.io/pypi/dm/invenio-grobid.svghttps://img.shields.io/github/license/inspirehep/invenio-grobid.svg

invenio模块与grobid api交互,从pdf中提取元数据。

这是一个实验性的开发人员预览版本。

功能

此模块提供一个接口,用于将pdf上载到Grobid实例,并允许将提取的元数据提交到可配置回调。

注意:这个包假设您已经设置了本地grobid rest服务。有关更多信息,请阅读grobid官方文档。

安装

pip install invenio-grobid

注意,您还需要运行grobidREST service

配置

invenio_grobid包添加到 overlay/config.py将由invenio应用程序加载程序获取。

使用GROBID_HOST配置Grobid REST服务的URL

inveniomanage config set GROBID_HOST 'http://localhost:8080'

如果要在提取后更改标准上载处理程序,请更新GROBID_RESULT_HANDLER

inveniomanage config set GROBID_RESULT_HANDLER 'my_overlay.grobid:upload_handler'

热门话题
junit有没有办法在Java中重新初始化静态类?   在浏览器中点击应用程序时java Play框架挂起   文件Java错误中的NullPointerException   使用Java中的SNMP查找网络中计算机的登录名   java包装服务器引导程序已弃用,有什么替代方案?   当客户在等待理发时,java信号量值是否存在问题?   java如何使用JavaMail仅下载特定类型的附件   如何在java中将十进制转换为十六进制   java Slick2D粒子系统不会生成粒子   java检测更改事件来自何处   将Java集合类型参数类设置为数组   java如何从eclipse导出为可运行JAR文件?   java EntityManager对象未注入Glassfish和Spring   swing从actionPerformed和actionListener Java返回字符串   java在给定另一个等价键对象的情况下获取映射项的当前键   无论输入如何,java网络都会产生相同的输出