Python中二进制文件IO,如何入门?
作为一个自学的Python爱好者,我该如何学习使用标准格式导入和导出二进制文件呢?
我想写一个脚本,把ePub电子书(其实就是一个包含XHTML和CSS的压缩文件)转换成mobipocket(Palmdoc)格式,这样亚马逊Kindle就能读取它(这是我正在进行的一个大项目的一部分)。
现在已经有一个很棒的开源项目可以管理电子书库:Calibre。我想自己尝试实现这个功能,作为一个学习和自我教学的练习。我开始查看他们的Python源代码,但发现自己完全搞不懂里面在说什么。当然,自学的一个大问题就是你不知道自己不知道什么。
在这种情况下,我知道自己对这些二进制文件以及如何在Python代码中处理它们了解得不多(struct?)。但我觉得我可能对二进制文件的知识缺失很多,我希望能得到一些帮助,理解如何处理这些文件。这里有一个关于mobi/palmdoc头部的详细概述。谢谢!
编辑:没有问题,好的观点!你有没有什么建议,可以帮助我获得关于处理二进制文件的基本知识?如果是Python相关的那就更好了,但其他方法也可以有帮助。
TOM:编辑为问题,添加了介绍/更好的标题