如何从pytesseract ex获取源文件

2024-03-29 14:34:54 发布

您现在位置:Python中文网/ 问答频道 /正文

因此,要点是在我从一组图像中提取OCR/tesseract数据之后,然后运行re.findall(r'example')

如何获取包含“Mountain”单词的源文件

我这一部分还是有点模糊。你能帮忙吗。谢谢

for index, row in df.iterrows():
result = row['text']#from the OCR
file_1 = re.match(r'Mountain', result)
file_2 = re.match(r'Lake', result)
if file_1: 
    print #how do I fetch/get the original file that has the matching word for file_1

Tags: the数据图像reforexamplematchresult