寻找一个小python机器学习advi

2024-04-25 23:19:03 发布

您现在位置:Python中文网/ 问答频道 /正文

我对Python和机器学习/自动数据输入有兴趣。然而,随着我的研究进展,我意识到有这么多不同的技术,每个都有自己的优势。你知道吗

我决定如果我向相反的方向学习,我可能会走得更远。例如,选择一个问题/任务,通过解决/完成它来学习。你知道吗

我偶尔要处理传真发票的数据,我希望做一个程序,可以输入这些为我一旦我扫描,然后在。你知道吗

传真基本上由两个相同的表格组成。每一行表示一个单独的worker。第一列是工人姓名(可选择6),第二列是地址,其余列是表示不同工作的勾选框。在页面顶部的框中还有一个发票ID。你知道吗

我希望有人能简单地解释一下他们会怎么做。他们是否会使用支持向量机进行文本识别或其他技术?你如何让一个程序明白第五个框中的勾号意味着“cleaned=yes”,左上角框中的数字就是ID。我做了一些研究,但不知道如何开始。当由于传真/扫描而无法保证绝对位置/大小时,如何将传真的某些部分(如顶部表格及其单元格)与页面的其余部分隔离开来。或者我必须得到几百份传真+这些传真的打印数据,然后比较它们,然后让它慢慢了解自己传真a和b的区别在这里是一个记号,身份证号码通常在这里。。。你知道吗

欢迎任何建议!你知道吗


Tags: 数据程序机器id发票页面方向技术
1条回答
网友
1楼 · 发布于 2024-04-25 23:19:03

大致来说,您可以将此过程分为两个阶段:

  1. 确定文本的位置。它位于ml和计算机视觉的交叉点,因为在文本识别部分之前,你需要找到文本的位置。这不是一个简单的任务,你可以找到行、框等,比如看opencvlib,它可能对简历相关的任务有用。如果您的所有文档都具有相同的精确形式(字段相对于扫描列表本身的位置),并且您可以完美地扫描它们,而不会出现扭曲(旋转、偏移),那么您可以尝试在字段所在的静态区域中搜索文本。

  2. 找到文本后,必须将每个字段的内容分解为单词,然后将单词分解为字符,然后可以将这些字符输入到识别器(ML部分),并获取每个字符本身的标签。而且手写文本几乎不可能(现在),因此在一般情况下很难识别手写文本。即使字段仅包含打印文本,我建议您避免此步骤,并使用OCR专用库,如tesseract

相关问题 更多 >