如何在python中裁剪图像的底部(带字幕的部分)

2024-04-26 21:22:52 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在用python从视频中提取字幕,我用python中的opencv来做,我把它分成帧,每个帧作为图像保存在磁盘上,我正在做ocr是的。但是我不想对整个图像执行ocr。我只想要字幕部分。我手动裁剪了图像,其值为278:360,因为我的图像大小是360:640。但是图像大小因不同的视频而异文件。现在我的问题是如何单独裁剪字幕部分程序化的。拜托做回答。谢谢提前

    textImage = image[278:360,:]

Tags: 文件图像image视频手动opencv磁盘ocr
1条回答
网友
1楼 · 发布于 2024-04-26 21:22:52

如果你确定字幕在那里,你可以取图像高度的最后三分之一。在

例如,对于以下图像:

enter image description here

按以下步骤进行:

  1. 将图像读入numpy数组:

在我的示例中,我使用的是来自skimage.ioimread,但是您可以使用opencv

from skimage.io import imread 
img = imread('http://cdn.wccftech.com/wp-content/uploads/2017/05/subtitle-of-a-blu-ray-movie.jpg')
img.shape #   >>> (383, 703, 3) 
  1. 获取图像的后三分之一(包含副标题):

其原理是将图像的高度除以3,然后取图像底部的三分之一:

^{pr2}$

得到的subtitle_img如下所示:

enter image description here

相关问题 更多 >