图像的游程编码

3 投票
1 回答
7024 浏览
提问于 2025-04-18 01:17

我正在为一个作业写一个运行长度图像编码器。我的代码在处理二进制和8位图像时运行得很好,但当我想编码4位图像时,它就不正常了。我使用的是Ubuntu 13.10、Python 3.3.4和Pillow库。执行以下代码应该打印出TrueTrue,但实际上打印的是TrueFalse

为了测试我的代码,我生成了一个随机列表来模拟图像。这个方法有效,列表的第一个值表示图像,但这个图像却无法正常工作。还有4个类似的图像,但它们都不行。我是不是漏掉了什么?

from PIL import Image
import random

def _encodeImage4bit(imagePixels, width, height):
    encodedImage = bytearray()

    count = 0

    prev = imagePixels[0]
    tempmap = ""

    for pixel in imagePixels:
        if count >= 15:
            encodedImage.append(15)
            encodedImage.append(pixel)
            tempmap += "1"
            tempmap += "0"
            count = 0

        if pixel == prev:
            count += 1
        else:
            if count > 1:
                encodedImage.append(count)
                tempmap += "1"
            encodedImage.append(prev)
            tempmap += "0"
            count = 1
            prev = pixel

    if count > 1:
        encodedImage.append(count)
        tempmap += "1"

    encodedImage.append(prev)
    tempmap += "0"

    encodedImage.extend([0] * _remaining(len(encodedImage)))
    tempmap += "1"*_remaining(len(tempmap))

    encodedImage = _set4bitMap(tempmap, encodedImage)

    return encodedImage

def _set4bitMap(imgMap, encodedImage):
    newImgMap = _divideByRow(imgMap, 8)

    tempImg = [_merge4bitTo8bit(encodedImage[i], encodedImage[i + 1]) for i in range(0, len(encodedImage), 2)]
    tempImg = _divideByRow(list(tempImg), 4)

    return bytearray(_flattenListOfList(_mergeMap(tempImg, newImgMap)))

def _decodeImage4bit(encodedImage, width, height):
    decodedImage = []

    imgMap, encImg = _get4bitMap(encodedImage)

    for index, i in enumerate(imgMap):
        if i == '1' and encImg[index] == 0:
            break

        if i == '1':
            decodedImage.extend([encImg[index + 1]] * encImg[index])
        elif imgMap[index - 1] != '1' or index == 0:
            decodedImage.append(encImg[index])

    return decodedImage

def _get4bitMap(encodedImage):
    imgMap = ""

    newEncodedImage = list(encodedImage)

    I = range(0, len(newEncodedImage), 5)

    for i in I:
        imgMap += '{0:08b}'.format(newEncodedImage[i])

    for i in sorted(list(I), reverse = True):
        del newEncodedImage[i]

    newEncodedImage = _flattenListOfList([_split8bitTo4bit(i) for i in newEncodedImage])

    return (imgMap, newEncodedImage)

def _split8bitTo4bit(eightbit):
    leftmask = 240
    rightmask = 15
    left = (eightbit & leftmask) >> 4
    right = eightbit & rightmask

    return (left, right)

def _merge4bitTo8bit(left, right):
    return (left << 4) | right

_remaining = lambda x, y = 8: 0 if x % y == 0 else y - (x % y)
_mergeMap = lambda z, x:[[int(x[index], 2)] + i for index, i in enumerate(z)]
_flattenListOfList = lambda flat:[item for sublist in flat for item in sublist]
_divideByRow = lambda flat, size: [flat[i:i + size] for i in range(0, len(flat), size)]


if __name__ == "__main__":
    img = [15] * 100
    img.extend([random.randrange(0, 16) for n in range(300)])
    encImg = _encodeImage4bit(img, 20, 20)
    decImg = _decodeImage4bit(encImg, 20, 20)
    print(str(decImg == img))

    imgpath = "../../images/4bit/baboon_4bit.bmp"
    img2 = Image.open(imgpath)
    encImg2 = _encodeImage4bit(list(img2.getdata(0)), img2.size[0], img2.size[1])
    decImg2 = _decodeImage4bit(encImg2, img2.size[0], img2.size[1])
    print(str(decImg2 == list(img2.getdata(0))))

这是《数据压缩完全参考》第四版第26页的算法。

这里,每个字节用一位来表示,说明这个字节是包含灰度值还是计数。不过,这次这些额外的位是以8位为一组进行累积的,每组在输出流中写入时,会在它“对应的”8个字节之前(或之后)写入。

我已经修改了代码以支持4位图像。

举个例子: 原始图像:12, 12, 12, 12, 12, 12, 12, 12, 12, 14, 3, 7, 10, 10, 10, 10, 5, 5, 5, 5, 5, 5, 1, . . .

第一步:找到重复的值 9, 12, 14, 3, 7, 4, 10, 6, 5, 1, . . .

第二步:生成一个映射,来识别哪个元素是像素值(0),哪个是重复次数(1) 1 0 0 0 0 1 0 1 0 . . .

第三步: 用零填充值,使长度成为8的倍数。 用一填充映射,使长度成为8的倍数。

第四步: 将映射分成8位一组,并将每组转换为整数。 133, . . .

第五步: 将每两个4位组合成一个8位。将左边的值左移4次,并与右边的数字进行或运算。 156, 227, 116, 166, 81, . . .

第六步: 将映射与值合并。现在映射中的每个整数表示值中的4个值。 133, 156, 227, 116, 166, . . .

解码过程是这个操作的反向过程。

1 个回答

4

我找到了我的问题。如果重复次数达到15次,就会往列表里多加一个值。为了防止这种情况发生,我把我的代码改成了这样。

    for pixel in imagePixels:
    if count >= 15:
        encodedImage.append(15)
        encodedImage.append(prev) #changed line
        tempmap += "1"
        tempmap += "0"
        count = 0
        prev = pixel #new line

撰写回答