将哈夫曼代码字符串转换为二进制

ss=['010101','10010101010'] # first one is short and takes only one byte in its int value # second one is long and takes two bytes print 'write it to file' with open('binary.bin','wb') as f: for s in ss: n=int(s,2) print n s=unichr(n) f.write(s) print 'read it to file' with open('binary.bin','rb') as f: for s in f.read(): print ord(s)

3条回答

网友
1楼 · 编辑于 2024-06-16 11:35:11

有一个字符串需要转换成数字。int接受可选的“base”作为参数。对于你例子中的字符串
>>> int('01010101010', 2) 682
一旦你有了一个数字（不是一个字符串），想要“实数”二进制是没有意义的，因为这个数字是相同的，你可以用任何基数来显示它。这意味着二进制100与十进制4是相同的数字，在你的程序中它们不是不同的数字。所以，一旦你把你的字符串变成一个数字，你就可以摆弄其中的位。在

网友
2楼 · 编辑于 2024-06-16 11:35:11

在Python中有两种不同的“二进制”表示法，您可能希望使用它们。在
大块头
一个是“bignum”或任意精度整数。这种类型在python2.x中称为long，在python3.x中称为int。顾名思义，这种表示在语义上是任意长度的整数，因此如果您计划对结果的数字进行算术运算，那么它非常有用。要解析二进制数字字符串，请使用
# Python 2 long(digit_str, 2)
或者
^{pr2}$
bitstring库
或者，正如Marc B在评论中建议的那样，使用^{} library。具体来说，对于转换，使用^{} function。在
对于哈夫曼编码，使用bitstring可能比将数据存储在byte-字符串中更好，因为哈夫曼代码通常不是8位的倍数；bitstring允许您操作任意长度的位串。缺点：bitstring不是标准库的一部分。在

网友
3楼 · 编辑于 2024-06-16 11:35:11

一种可能的方法（使用位字符串库），这有一定的道理，但仍包含不正确的地方：

使用位串库（感谢机械蜗牛和Marc B）

用于写入文件。在

步骤：

将纯文本编码为二进制表示字符串
将所有这些字符串串联起来形成一个较长的字符串
使用bitstring.BitArray位串转换为十六进制格式
将十六进制字符串写入文件

阅读：

从文件中读取十六进制字符串
使用位数组将其转换回位字符串
开始解码

代码：

ss=['01010100','10010101010','010101110101010101'] #encoded message


from bitstring import BitArray,BitStream
print 'write it to file'
with open('binary.bin','wb') as f:
    s=''.join(ss);
    b=BitArray(bin=s)                 
    f.write(b.tobytes())# thanks to Scott, tobytes() method is very useful

print 'read it to file'
b=BitArray(filename='binary.bin')
print b.bin

大块头

`bitstring`库

相关问题更多 >

编程相关推荐

热门问题

热门文章