invenio模块与grobid api交互以提取元数据。
invenio-grobid的Python项目详细描述
invenio模块与grobid api交互,从pdf中提取元数据。
- 免费软件:gplv2许可证
- 文档:https://invenio-grobid.readthedocs.org
这是一个实验性的开发人员预览版本。
功能
此模块提供一个接口,用于将pdf上载到Grobid实例,并允许将提取的元数据提交到可配置回调。
注意:这个包假设您已经设置了本地grobid rest服务。有关更多信息,请阅读grobid官方文档。
配置
将invenio_grobid包添加到 overlay/config.py将由invenio应用程序加载程序获取。
使用GROBID_HOST配置Grobid REST服务的URL
inveniomanage config set GROBID_HOST 'http://localhost:8080'
如果要在提取后更改标准上载处理程序,请更新GROBID_RESULT_HANDLER。
inveniomanage config set GROBID_RESULT_HANDLER 'my_overlay.grobid:upload_handler'
用法
默认情况下,uploader接口在/grobid端点下可用。例如http://localhost:4000/grobid
- 选择要从中提取元数据的pdf并点击Upload。
- 稍等,将显示元数据。
- 单击Submit按钮将元数据推送到GROBID_RESULT_HANDLER
特别感谢joseph boyd(@jcboyd)和gilles louppe(@glouppe)对grobid的支持。
快乐的黑客和感谢飞行因维尼奥格罗比德。
更改
版本0.1.0(2015-10-09发布)
- 首次公开发行。
推荐PyPI第三方库
- 热门话题
- junit有没有办法在Java中重新初始化静态类? 在浏览器中点击应用程序时java Play框架挂起 文件Java错误中的NullPointerException 使用Java中的SNMP查找网络中计算机的登录名 java包装服务器引导程序已弃用,有什么替代方案? 当客户在等待理发时,java信号量值是否存在问题? java如何使用JavaMail仅下载特定类型的附件 如何在java中将十进制转换为十六进制 java Slick2D粒子系统不会生成粒子 java检测更改事件来自何处 将Java集合类型参数类设置为数组 java如何从eclipse导出为可运行JAR文件? java EntityManager对象未注入Glassfish和Spring swing从actionPerformed和actionListener Java返回字符串 java在给定另一个等价键对象的情况下获取映射项的当前键 无论输入如何,java网络都会产生相同的输出