Cropyble是一个模块,允许用户轻松地对包含可识别文本的图像执行裁剪。该模块利用Google的光学字符识别(OCR)技术。
cropyble的Python项目详细描述
可折叠的
Author:斯凯勒汉堡 Version:1.2.1
概述
Cropyble是一个类,允许用户轻松地对包含可识别文本的图像执行裁剪。该类利用光学字符识别(OCR)技术,辅以Tesseract OCR和Pytheract。包含清晰、打印、非装饰性文本的图像与OCR功能配合使用效果最佳。在
这是:sparkles:my first package on PyPI:sparkles:我欢迎反馈。如果你发现了需要改进的地方,请随时提交问题。在
建筑
包装
- pillow:一个用于处理图像的Python包
- pytesseract:Tesseract的Python绑定
- tesseract:命令行程序和OCR引擎
入门
Linux和Mac操作系统
- 这个类需要一个附加的软件,而PyPI不能提供这个软件。使用
sudo apt-get install tesseract-ocr
在您的计算机上安装tesseract - 使用
pip3 install cropyble
或最好使用环境管理器(如^{} )安装Cropyble - 将以下import语句放在文件的顶部:
from cropyble import Cropyble
- 创建Cropyble实例并开始裁剪!在
示例:
# example.pyfromcropybleimportCropyblemy_img=Cropyble('demo.jpg')my_img.crop('world','output.jpg')
在上面的例子中,假设demo.jpg
是一个包含单词“hello world”并且与example.py
位于同一目录中的图像。Cropyble的一个实例是用输入图像的路径创建的。Cropyble然后对图像执行OCR,并在类的实例中存储有关识别的字符和单词以及它们的边界框的信息。通过调用实例的.crop()
方法,使用图像中包含的单词和输出文件的路径,可以创建该单词的裁剪图像。如果输出文件不存在,则创建输出文件;如果输出文件已存在,则会覆盖输出文件。在
美国石油学会
- Cropyble(input_path):接受表示输入图像位置的字符串。Cropyble使用
pytesseract
在图像上运行OCR,并存储边界框以供将来的作物识别单词和字符。在 - ^{emm>表示第二个图像的单词{emm>和字符串{emm>表示的第二个单词{emm>}表示第二个单词{emm>}。从原始图像生成查询文本的裁剪副本,并将其保存在指定位置。在
- .get_box(word):接受一个表示在图像中识别的单词的字符串。以格式(x1,y1,x2,y2)返回一个表示单词边界框的元组。图像的原点(0,0)位于图像的左上角。在
- .get_words():返回在输入图像中识别的单词列表。在
更改日志
2019年7月22日-0.1.0
- 修正了边界框数学。图像被正确裁剪。在
2019年7月27日-0.2.0
- 将裁剪函数重构到一个类中,以最小化在单个图像上执行多次裁剪所需的工作量。在
2019年7月30日-0.3.0
- Cropyble现在可以接受输入图像的路径,Cropyble()接受输出图像的路径。在
2019年2月8日-1.1.0
- Cropyble现在可以使用相同的Cropyble()方法裁剪图像中识别的单词和字符。在
19年8月10日-1.1.4
- 为打包而重构
- 上传到PyPI,颠簸的旅程
20年6月1日-1.2.0
- 向Cropyble类添加了
__repr__
和__str__
魔术方法。在 - 向Cropyble类添加了
.get_box()
和.get_words()
方法
20年7月1日-1.2.1
- 重新发布给PyPI
- 项目
标签: