如何使用水平线谷歌视觉检测日语单词或使用文本检测检测文件中的文本（PDF）

2024-06-16 14:17:55 发布

男 | 程序猿一只，喜欢编程写python代码。

我使用googlevision检测PDF文件中的文档文本，但在响应结果上遇到了一些问题

示例

[甲，乙，丙]

[x，y，z]

[1、2、3]

预期结果：[a，b，c]，[x，y，z]，[1,2,3]或[a]，[b]，[c]，[x]，[y]，[z]，[1]，[2]，[3]

实际结果：[a，b][x，y][1,2][c，z，3]

{“x”：0.5579832，“y”：0.912114}

{“x”：0.5579832，“y”：0.91567695}

{“x”：0.53781515，“y”：0.91567695}

{“x”：0.53781515，“y”：0.912114}

页面有宽度和高度，但有些x，y有一个值>；1.0它会超出页数限制我怎样才能转换为宽度和高度用点

谢谢你^^

参考文献： https://cloud.google.com/vision/docs/pdf 只更改image\u context={“language\u hints”：[“ja”]}

Tags：文件文档 https 文本 com cloud 宽度高度

0条回答

目前没有回答