OCR准确性报告器
ocraccuracyreporter的Python项目详细描述
====
概述
==
=
您的ocr管道可能有不同的阶段,并且可能使用不同的工具。
您需要一种简单的方法将样本作为一个整体或逐块运行,并且可以说ocr精度为98%。
====
=
===
>
>;>;pip从ocraccurycyreporter安装ocraccurycyreporter。主题:初始化报告者
>;>;oreport=oar(应为'john',给定为'joh',label='name')
>;>;打印(oreport)
>;>;name,john,joh,86100,86,86,94,1
因此,如果创建的CSV报告的标题信息为label、expected、given、ratio、partial、ratio、token sort ratio,则可能需要初始化expected alone
>>;oreport=oar(expected='joh',label='name')
>;oreport.given='joh'
>; ,Token_set_ratio,Jaro_Winkler,距离
姓名,约翰,约翰,约翰,86100,86,86,94,1
…主题:报表中的项
比率-使用基于距离的纯levenshtein匹配
(100-表示完全匹配)
交集
jaro_winkler-该算法赋予公共前缀更多权重
(例如,某些部分是好的,缺少其他字符)
距离-这显示给定的
与预期的
==
==
类变量
==
预期-预期结果
给定-从OCR中得到的结果管道
期望字符总数-计算期望字符数
期望字符总数-计算期望字符数
给定字符总数-计算给定字符数
给定字符总数-计算给定字符数
概述
==
=
您的ocr管道可能有不同的阶段,并且可能使用不同的工具。
您需要一种简单的方法将样本作为一个整体或逐块运行,并且可以说ocr精度为98%。
====
=
===
>
>;>;pip从ocraccurycyreporter安装ocraccurycyreporter。主题:初始化报告者
>;>;oreport=oar(应为'john',给定为'joh',label='name')
>;>;打印(oreport)
>;>;name,john,joh,86100,86,86,94,1
因此,如果创建的CSV报告的标题信息为label、expected、given、ratio、partial、ratio、token sort ratio,则可能需要初始化expected alone
>>;oreport=oar(expected='joh',label='name')
>;oreport.given='joh'
>;
姓名,约翰,约翰,约翰,86100,86,86,94,1
…主题:报表中的项
比率-使用基于距离的纯levenshtein匹配
(100-表示完全匹配)
交集
jaro_winkler-该算法赋予公共前缀更多权重
(例如,某些部分是好的,缺少其他字符)
距离-这显示给定的
与预期的
==
==
类变量
==
给定-从OCR中得到的结果管道
期望字符总数-计算期望字符数
期望字符总数-计算期望字符数
给定字符总数-计算给定字符数
给定字符总数-计算给定字符数