如何使用opencv python从kyc文档中检测和提取文本?

2024-05-28 19:02:06 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一张阿达尔卡的照片。我想检测aadhar卡上的文本。我使用了EAST文本检测算法来检测文本,但没有找到好的结果。现在我正在尝试另一种方法,例如

  1. 将图像转换为灰度

  2. 应用阈值

  3. 寻找轮廓

    image11=cv2.imread('1.jpg')
    gray_image=cv2.cvtColor(image11, cv2.COLOR_BGR2GRAY)
    threshed=cv2.adaptiveThreshold(gray_image,255,cv2.ADAPTIVE_THRESH_GAUSSIAN_C,\
                              cv2.THRESH_BINARY,11,2)
    ##  Morph-op to remove noise
    kernel = cv2.getStructuringElement(cv2.MORPH_ELLIPSE, (11,11))
    morphed = cv2.morphologyEx(threshed, cv2.MORPH_CLOSE, kernel)
    cnts = cv2.findContours(morphed, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)[-2]
    

但在找到轮廓后,下一步是什么?还是其他方法?这样我就能检测到文本了。谢谢

输入图像:

enter image description here


Tags: 方法图像image文本cv2kernel照片轮廓
1条回答
网友
1楼 · 发布于 2024-05-28 19:02:06

使用您获得的以下文档

https://pypi.org/project/pan-aadhar-ocr/

from pan_aadhar_ocr import Pan_Info_Extractor, Aadhar_Info_Extractor
extractor = Aadhar_Info_Extractor()
result = extractor.info_extractor('full.jpg','full.jpg')

相关问题 更多 >

    热门问题