如何使用水平线谷歌视觉检测日语单词或使用文本检测检测文件中的文本(PDF)

2024-06-16 14:17:55 发布

您现在位置:Python中文网/ 问答频道 /正文

我使用googlevision检测PDF文件中的文档文本,但在响应结果上遇到了一些问题

  1. 响应结果很好,但有些符号用垂直线检测。我知道日本用竖线写字,但我不需要。我怎样才能为这个添加条件

示例

[甲,乙,丙]

[x,y,z]

[1、2、3]

预期结果:[a,b,c],[x,y,z],[1,2,3]或[a],[b],[c],[x],[y],[z],[1],[2],[3]

实际结果:[a,b][x,y][1,2][c,z,3]

  1. 如果1是不可能的。我可以改变功能的类型是文本检测吗

  2. 边界框有4个点

{“x”:0.5579832,“y”:0.912114}

{“x”:0.5579832,“y”:0.91567695}

{“x”:0.53781515,“y”:0.91567695}

{“x”:0.53781515,“y”:0.912114}

页面有宽度和高度,但有些x,y有一个值>;1.0它会超出页数限制我怎样才能转换为宽度和高度用点

谢谢你^^

参考文献: https://cloud.google.com/vision/docs/pdf 只更改image\u context={“language\u hints”:[“ja”]}

https://medium.com/weareservian/my-tips-for-getting-help-with-google-cloud-platform-114b03f807dc


Tags: 文件文档https文本comcloud宽度高度