用OpenCV计算离散余弦变换

3 投票

2 回答

9277 浏览

提问于 2025-04-17 05:55

我正在尝试使用OpenCV中的dct()函数来计算离散余弦变换，但结果看起来很奇怪。

我的脚本是：

import os, sys
import cv, cv2
import numpy as np

fn1 = 'original.jpg'
img1 = cv2.imread(fn1, cv2.CV_LOAD_IMAGE_GRAYSCALE)

h, w = img1.shape[:2]
vis0 = np.zeros((h,w), np.float32)
vis0[:h, :w] = img1
vis1 = cv2.dct(vis0)
img2 = cv.CreateMat(vis1.shape[0], vis1.shape[1], cv.CV_32FC3)
cv.CvtColor(cv.fromarray(vis1), img2, cv.CV_GRAY2BGR)

cv.ShowImage('',img2)
cv2.waitKey()
cv.SaveImage('saved.jpg', img2)

这个脚本运行没有错误，但通过ShowImage()显示的图像和通过SaveImage()保存的图像看起来差别很大。不幸的是，我找不到任何经过DCT处理的图像样本，所以我不确定哪一张是正确的。

原始图像：

显示的DCT图像：

保存的DCT图像：

为什么显示的DCT图像和保存的DCT图像之间会有这么大的差异？哪一张是正确的？

图像处理 opencv 图像显示图像质量数字信号处理图像保存 dct 离散余弦变换

2 个回答

保存的图片其实是一样的，不过在保存之前，颜色值被限制在0到255之间，并且转换成了字节格式（numpy.uint8）。如果有负值，就会被设为0；如果超过255的值，就会被设为255。

cv2.imshow("before_save", vis1)
vis1[vis1>255] = 255
vis1[vis1<0] = 0
cv2.imshow("saved", vis1.astype(np.uint8))

回答于 2025-04-17 由 Python大师

分享举报

看起来你展示了DCT的复杂输出。因为你尝试保存一个有两个通道的图像（DCT输出有两个通道，一个是实部，一个是虚部），所以它只保存了实部（这个部分和幅度有点接近）。

所以，从你的DCT输出中，使用magnitude()和phase()这两个函数来提取有用的信息。把它们分开显示。

最重要的是，仔细阅读一下关于DCT的内容（http://en.wikipedia.org/wiki/Discrete_cosine_transform），这样你才能明白自己在做什么。

回答于 2025-04-17 由 Python大师

分享举报

用OpenCV计算离散余弦变换

2 个回答

撰写回答