向文件写入的数据比读取的数据多？

def __main__(): operating_file = open('photo.jpg', 'rb') while True: data_chunk = operating_file.read(64*1024) if len(data_chunk) == 0: print('COMPLETE') break else: new_operation = open('newFile.txt', 'ab') for character in list(data_chunk): new_operation.write(chr(character).encode('utf-8')) if __name__ == '__main__': __main__()

2条回答

网友

1楼 · 编辑于 2024-06-17 12:45:52

当您有一个代码点并用UTF-8编码时，结果可能比原始的包含更多的字节。你知道吗

对于一个具体的例子，请参考WikiPedia page并考虑十六进制值0xA2。你知道吗

这是一个二进制值，小于255，但当编码为UTF8时，它变成0xC2, 0xA2。你知道吗

考虑到要从源文件中提取字节，我的第一个建议是直接将字节传递给目标文件的编写器。你知道吗

如果您试图理解文件I/O是如何工作的，那么在使用二进制文件模式时要小心encode()。二进制文件不需要编码或解码-它们是原始数据。你知道吗

网友

2楼 · 编辑于 2024-06-17 12:45:52

下面是一个您可能希望使用的简单示例：

import sys

f = open('gash.txt', 'rb')
stuff=f.read()    # stuff refers to a bytes object
f.close()

print(stuff)

f2 = open('gash2.txt', 'wb')

for i in stuff:
    f2.write(i.to_bytes(1, sys.byteorder))

f2.close()

如您所见，bytes对象是iterable，但是在for循环中，我们在i中得到了一个int。要将其转换为字节，我使用int.to_bytes()方法。你知道吗

相关问题更多 >

编程相关推荐

热门问题

热门文章