用OpenCV计算离散余弦变换

3 投票
2 回答
9277 浏览
提问于 2025-04-17 05:55

我正在尝试使用OpenCV中的dct()函数来计算离散余弦变换,但结果看起来很奇怪。

我的脚本是:

import os, sys
import cv, cv2
import numpy as np

fn1 = 'original.jpg'
img1 = cv2.imread(fn1, cv2.CV_LOAD_IMAGE_GRAYSCALE)

h, w = img1.shape[:2]
vis0 = np.zeros((h,w), np.float32)
vis0[:h, :w] = img1
vis1 = cv2.dct(vis0)
img2 = cv.CreateMat(vis1.shape[0], vis1.shape[1], cv.CV_32FC3)
cv.CvtColor(cv.fromarray(vis1), img2, cv.CV_GRAY2BGR)

cv.ShowImage('',img2)
cv2.waitKey()
cv.SaveImage('saved.jpg', img2)

这个脚本运行没有错误,但通过ShowImage()显示的图像和通过SaveImage()保存的图像看起来差别很大。不幸的是,我找不到任何经过DCT处理的图像样本,所以我不确定哪一张是正确的。

原始图像:

original

显示的DCT图像:

shown

保存的DCT图像:

saved

为什么显示的DCT图像和保存的DCT图像之间会有这么大的差异?哪一张是正确的?

2 个回答

2

保存的图片其实是一样的,不过在保存之前,颜色值被限制在0到255之间,并且转换成了字节格式(numpy.uint8)。如果有负值,就会被设为0;如果超过255的值,就会被设为255。

cv2.imshow("before_save", vis1)
vis1[vis1>255] = 255
vis1[vis1<0] = 0
cv2.imshow("saved", vis1.astype(np.uint8))
2

看起来你展示了DCT的复杂输出。因为你尝试保存一个有两个通道的图像(DCT输出有两个通道,一个是实部,一个是虚部),所以它只保存了实部(这个部分和幅度有点接近)。

所以,从你的DCT输出中,使用magnitude()和phase()这两个函数来提取有用的信息。把它们分开显示。

最重要的是,仔细阅读一下关于DCT的内容(http://en.wikipedia.org/wiki/Discrete_cosine_transform),这样你才能明白自己在做什么。

撰写回答