寻找一个小python机器学习advi - 问答 - Python中文网

寻找一个小python机器学习advi

2024-04-25 23:19:03 发布

您现在位置：Python中文网/ 问答频道 /正文

男 | 程序猿一只，喜欢编程写python代码。

我对Python和机器学习/自动数据输入有兴趣。然而，随着我的研究进展，我意识到有这么多不同的技术，每个都有自己的优势。你知道吗

我决定如果我向相反的方向学习，我可能会走得更远。例如，选择一个问题/任务，通过解决/完成它来学习。你知道吗

我偶尔要处理传真发票的数据，我希望做一个程序，可以输入这些为我一旦我扫描，然后在。你知道吗

传真基本上由两个相同的表格组成。每一行表示一个单独的worker。第一列是工人姓名（可选择6），第二列是地址，其余列是表示不同工作的勾选框。在页面顶部的框中还有一个发票ID。你知道吗

我希望有人能简单地解释一下他们会怎么做。他们是否会使用支持向量机进行文本识别或其他技术？你如何让一个程序明白第五个框中的勾号意味着“cleaned=yes”，左上角框中的数字就是ID。我做了一些研究，但不知道如何开始。当由于传真/扫描而无法保证绝对位置/大小时，如何将传真的某些部分（如顶部表格及其单元格）与页面的其余部分隔离开来。或者我必须得到几百份传真+这些传真的打印数据，然后比较它们，然后让它慢慢了解自己传真a和b的区别在这里是一个记号，身份证号码通常在这里。。。你知道吗

欢迎任何建议！你知道吗

Tags：数据程序机器 id 发票页面方向技术

1条回答

网友

1楼 · 发布于 2024-04-25 23:19:03

大致来说，您可以将此过程分为两个阶段：

确定文本的位置。它位于ml和计算机视觉的交叉点，因为在文本识别部分之前，你需要找到文本的位置。这不是一个简单的任务，你可以找到行、框等，比如看opencvlib，它可能对简历相关的任务有用。如果您的所有文档都具有相同的精确形式（字段相对于扫描列表本身的位置），并且您可以完美地扫描它们，而不会出现扭曲（旋转、偏移），那么您可以尝试在字段所在的静态区域中搜索文本。
找到文本后，必须将每个字段的内容分解为单词，然后将单词分解为字符，然后可以将这些字符输入到识别器（ML部分），并获取每个字符本身的标签。而且手写文本几乎不可能（现在），因此在一般情况下很难识别手写文本。即使字段仅包含打印文本，我建议您避免此步骤，并使用OCR专用库，如tesseract

相关问题更多 >

编程相关推荐

热门问题

热门文章