手写文档的分词

2024-06-07 17:40:02 发布

您现在位置:Python中文网/ 问答频道 /正文

我在做DIAR的项目。你知道吗

我要对圣经的扫描页进行分词(下图)。你知道吗

Scanned page of Bible

过程是:

  1. 二值化
  2. 旋转
  3. 直线分割
  4. 列分割
  5. 分词

直到第四点一切正常。你知道吗

Line Segment

如何从线段中提取每个单词?这样做的目的只是将行分割成单词,而不是识别出所写的内容。你知道吗


Tags: 项目目的内容圣经过程单词直线分词

热门问题