python中utf16格式的文件写入和文件读取

def filewrite(folderpath, filename, strdata, encmode): try: path = os.path.join(folderpath, filename) if not path: return create_dir_path(folderpath) #path = os.path.join(folderpath, filepath) with codecs.open(path, mode='w', encoding=encmode) as fp: fp.write(unicode(strdata)) except Exception, e: raise Exception(e)

def read_in_chunks(file_object, chunk_size=4096): try: while True: data = file_object.read(chunk_size) if not data: break yield data except Exception, ex: raise ex def fileread(folderPath, fileName, encmode): try: path = os.path.join(folderPath, fileName) fileData = '' if os.access(path, os.R_OK): with codecs.open(path, mode='r', encoding=encmode) as fp: for block in read_in_chunks(fp): fileData = fileData + block return fileData return '' except Exception, ex: raise ex

1条回答

网友

1楼 · 发布于 2024-05-23 17:46:42

你的代码似乎没有什么问题。在我的机器上运行它会自动在文件的开头创建正确的BOM。在

BOM是文件开头的一个字节序列，它指示应该读取哪个顺序的多字节编码（UTF-16）——如果您感兴趣，可以阅读system endianness。在

如果您在mac/linux上运行，您应该能够hd your_utf16file或{}来检查文件中的原始字节。在运行代码时，我在开头看到了正确的字节0xff 0xfe。在

尝试将fileread函数部分替换为

    with codecs.open(path, mode='r', encoding=encmode) as fp:
        for block in fp:
            print block

以确保在消除外部因素（您的read_in_chunks功能）后仍然可以读取该文件。在

相关问题更多 >

编程相关推荐

热门问题

热门文章