有没有办法从postscript文件中提取文本信息?(.ps.eps)

2024-04-27 23:46:20 发布

您现在位置:Python中文网/ 问答频道 /正文

我想提取postscript图像文件中包含的文本信息(轴标签的标题)。 这些图像是用pgplot生成的。我在Ubuntu上尝试过ps2ascii和ps2text,但没有产生任何有用的结果。有人知道另一种方法吗?在

谢谢


Tags: 方法图像文本信息标题ubuntu图像文件标签
1条回答
网友
1楼 · 发布于 2024-04-27 23:46:20

pgplot很可能直接用线条绘制文本中的字体,而不是使用文本。尤其是由于pgplot被设计成可以输出到包括绘图仪在内的各种设备上,因此您必须这样做。在

编辑:

如果你有足够的情节值得 这个努力比这很简单 图像处理任务。转换每个 翻页到像tiff这样的单声道音乐 chrome将图像设置为二进制, 文本将是最大像素值。在

使用模板匹配技术。 如果你有一套有限的 可能的标签然后只匹配 整个标签,你甚至可以开始 尺寸正确的模板 还有旋转。然后每个人都打上标记 打印为包含标签[1-n],否 需要阅读实际文本。在

如果你 不知道标签那你就可以了 还是很容易做OCR,只是 提取轴周围的区域, 垂直旋转-使用 谷歌的免费OCR库

如果你有pgplot你甚至可以 为OCR或 模板图像更直接 而不是从 图像列表

相关问题 更多 >