NLP:文档OCR中单词的位置特征

2024-03-29 11:10:59 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在尝试将NLP应用于OCR文档。要提取命名实体,如何使用文档中单词的位置等功能?在

例如,我有一份健康报告,我需要从报告中提取某个特定区域的化学术语,避免它们在其他地方出现。我可以用{top:x , left:y}值为其定义位置特性吗?在

有没有sklearn图书馆?在


Tags: 文档功能实体区域nlp定义top报告
1条回答
网友
1楼 · 发布于 2024-03-29 11:10:59

您可以构建提取区域来获取此内容。 换句话说,将具有所需内容的文档分组到图像的给定区域中,然后从该区域获取所有图像的内容。在

相关问题 更多 >