PDF/TIFF文件文本检测

2024-03-29 01:39:38 发布

您现在位置:Python中文网/ 问答频道 /正文

我目前正在尝试在我的项目中使用Google的云视觉API。问题是用于文档文本检测的googlecloudvisionapi只接受Google云服务URI作为输入和输出目的地。但是我所有的项目,数据都在amazons3服务器上,不能直接与这个API一起使用。在

要点注:在

  1. 所有数据应仅保存在S3中。在
  2. 我现在无法将云存储更改为GCS。在
  3. 我无法从S3下载文件并上传到GCS手动操作数 每天收到的文件少于1000个 十万。在
  4. 即使我可以自动下载和上传pdf文件 会成为整个项目的瓶颈,因为我必须处理 并发问题和内存管理。在

有什么解决方法可以让这个API与s3uri一起工作吗?我需要你的帮助。在

谢谢你


Tags: 文件数据项目文档文本服务器apis3
1条回答
网友
1楼 · 发布于 2024-03-29 01:39:38

目前,除了Google云存储之外,visionapi不支持url。有一个feature request用于图像搜索,该API与特定的url一起使用,您可以要求对PDF/TIFF文档也考虑这个特性,或者为这个场景提出一个新的feature request。在

相关问题 更多 >