在照片中查找文本

scene-text的Python项目详细描述


场景文本检测与识别

这个项目包场景文本算法易于使用。照片中的场景比扫描文档中的场景更难进行文本检测和识别。后者主要被称为ocr,是一个很好解决的问题。请注意,由于使用了深度学习算法,文本检测和识别速度相当慢,特别是在仅使用CPU的机器上,以及对于包含大量单词的图像。精确度已达到令人印象深刻的水平,但仍低于人类的表现。目前,有以下算法可用。

EAST用于检测,其中实现主要从Jan Zdenek复制。

MORAN用于识别,其中实现主要是从Canjie Luo复制的。

安装:

pip install scene_text

python的基本用法:

import cv2

# The first import after installation can take a little longer as it downloads
# pre-trained models and compiles some native code.
from scene_text import AllWordsRecognizer

# initialize models
pipeline = AllWordsRecognizer()

# read an image
img = cv2.imread('path/to/my/image/file')[:, :, ::-1]

# detect and recognize all words in the image
words, boxes = pipeline.get_all_words(img)

命令行的基本用法:

scene_text my/input/image/folder my/output/folder

如果你对复杂的依赖关系有困难,请尝试Docker:

docker build -t scene_text .

docker run --rm -i -t -v ${PWD}:/scene_text scene_text

# ...

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java检查时间更长   从文件中只读取一些字符串并将其存储在java的堆栈中   java变量引用与避免空指针的重复get调用   java将xml数据转换为字符串   java在if语句中对字符串中的表达式求值   java找不到符号IllegalArgumentException   java将servlet的返回值从JSP转换为JSON   在eclipse中运行java应用程序与直接运行它有何不同?   如何在java中创建用作密码的随机字符串   java Mojo Codehaus属性插件替代方案   关于Hibernate中Clob对象的java问题   java如何使用websocket范围测试组件?   java在mongodb中将mapreduce查询转换为聚合   EclipseJava远程调试:如何确保项目中的代码与JVM中运行的代码相同?   java初学者Android:ListView影响下一个类   Java swing BasicTextFieldUI绘制问题   当我在操作栏上添加溢出菜单时,java 安卓 Action Up按钮不起作用   java如何将只包含标题(无行)的数据集写入hdfs位置(csv格式),以便在下载时包含标题?