如何在python中裁剪图像的底部（带字幕的部分） - 问答 - Python中文网

如何在python中裁剪图像的底部（带字幕的部分）

2024-04-26 21:22:52 发布

您现在位置：Python中文网/ 问答频道 /正文

男 | 程序猿一只，喜欢编程写python代码。

我正在用python从视频中提取字幕，我用python中的opencv来做，我把它分成帧，每个帧作为图像保存在磁盘上，我正在做ocr是的。但是我不想对整个图像执行ocr。我只想要字幕部分。我手动裁剪了图像，其值为278:360，因为我的图像大小是360:640。但是图像大小因不同的视频而异文件。现在我的问题是如何单独裁剪字幕部分程序化的。拜托做回答。谢谢提前

    textImage = image[278:360,:]

Tags：文件图像 image 视频手动 opencv 磁盘 ocr

1条回答

网友

1楼 · 发布于 2024-04-26 21:22:52

如果你确定字幕在那里，你可以取图像高度的最后三分之一。在

例如，对于以下图像：

按以下步骤进行：

将图像读入numpy数组：

在我的示例中，我使用的是来自skimage.io的imread，但是您可以使用opencv：

from skimage.io import imread 
img = imread('http://cdn.wccftech.com/wp-content/uploads/2017/05/subtitle-of-a-blu-ray-movie.jpg')
img.shape #   >>> (383, 703, 3)

获取图像的后三分之一（包含副标题）：

其原理是将图像的高度除以3，然后取图像底部的三分之一：

^{pr2}$

得到的subtitle_img如下所示：

相关问题更多 >

编程相关推荐

热门问题

热门文章