用OpenCV计算离散余弦变换
我正在尝试使用OpenCV中的dct()函数来计算离散余弦变换,但结果看起来很奇怪。
我的脚本是:
import os, sys
import cv, cv2
import numpy as np
fn1 = 'original.jpg'
img1 = cv2.imread(fn1, cv2.CV_LOAD_IMAGE_GRAYSCALE)
h, w = img1.shape[:2]
vis0 = np.zeros((h,w), np.float32)
vis0[:h, :w] = img1
vis1 = cv2.dct(vis0)
img2 = cv.CreateMat(vis1.shape[0], vis1.shape[1], cv.CV_32FC3)
cv.CvtColor(cv.fromarray(vis1), img2, cv.CV_GRAY2BGR)
cv.ShowImage('',img2)
cv2.waitKey()
cv.SaveImage('saved.jpg', img2)
这个脚本运行没有错误,但通过ShowImage()显示的图像和通过SaveImage()保存的图像看起来差别很大。不幸的是,我找不到任何经过DCT处理的图像样本,所以我不确定哪一张是正确的。
原始图像:

显示的DCT图像:

保存的DCT图像:

为什么显示的DCT图像和保存的DCT图像之间会有这么大的差异?哪一张是正确的?
2 个回答
2
保存的图片其实是一样的,不过在保存之前,颜色值被限制在0到255之间,并且转换成了字节格式(numpy.uint8)。如果有负值,就会被设为0;如果超过255的值,就会被设为255。
cv2.imshow("before_save", vis1)
vis1[vis1>255] = 255
vis1[vis1<0] = 0
cv2.imshow("saved", vis1.astype(np.uint8))
2
看起来你展示了DCT的复杂输出。因为你尝试保存一个有两个通道的图像(DCT输出有两个通道,一个是实部,一个是虚部),所以它只保存了实部(这个部分和幅度有点接近)。
所以,从你的DCT输出中,使用magnitude()和phase()这两个函数来提取有用的信息。把它们分开显示。
最重要的是,仔细阅读一下关于DCT的内容(http://en.wikipedia.org/wiki/Discrete_cosine_transform),这样你才能明白自己在做什么。