我试图使用OpenCV中的dct()函数来计算离散余弦变换,但得到了奇怪的结果。
我的剧本是:
import os, sys
import cv, cv2
import numpy as np
fn1 = 'original.jpg'
img1 = cv2.imread(fn1, cv2.CV_LOAD_IMAGE_GRAYSCALE)
h, w = img1.shape[:2]
vis0 = np.zeros((h,w), np.float32)
vis0[:h, :w] = img1
vis1 = cv2.dct(vis0)
img2 = cv.CreateMat(vis1.shape[0], vis1.shape[1], cv.CV_32FC3)
cv.CvtColor(cv.fromarray(vis1), img2, cv.CV_GRAY2BGR)
cv.ShowImage('',img2)
cv2.waitKey()
cv.SaveImage('saved.jpg', img2)
这看起来运行正常,但是ShowImage()显示的图像和SaveImage()保存的图像看起来非常不同。不幸的是,我似乎找不到任何经过DCT处理的图像样本,所以我不确定哪一个是正确的。
原始图像:
显示的DCT图像:
保存的DCT图像:
为什么显示的DCT图像和保存的DCT图像有这么大的区别?哪个是正确的?
保存的图像实际上是相同的,但在保存为JPEG之前,这些值被钳制为[0..255]并转换为字节(numpy.uint8)。负值设置为零,高于255的值设置为255。
你好像显示了DCT的复杂输出。而且,因为您试图保存一个2通道图像(DCT输出2通道-一个用于真实,一个用于虚部),所以它只保存了真实部分(以某种方式接近大小)。
因此,从DCT输出中,使用magnitude()和phase()函数提取有用的信息。分别展示
而且,最重要的是,仔细阅读关于DCT(http://en.wikipedia.org/wiki/Discrete_cosine_transform)的内容,这样你就知道自己在做什么。
相关问题 更多 >
编程相关推荐