用程序化方式选择什么文档标准比较好?
我正在写一个程序,需要输入一个文档,程序要替换一些值,插入一个表格,并把它转换成PDF格式。这个程序是用Python和Qt(PyQt)写的。有没有什么大家都知道的文档标准,可以方便地用代码来处理?它必须是跨平台的,最好是开源的。
我查过微软的Doc和Docx格式,这些是二进制格式,我没法直接编辑。Python有相关的库,但这些库只在Windows上可用。
Open Office的ODT/ODF格式是压缩的xml文件,所以我可以编辑这个文件,但没有命令行工具或者其他方法可以把文件程序化地转换成PDF。Open Office提供了一些库,但你需要从命令行启动Open Office,开启一个服务器等等。而且我的客户可能没有安装Open Office。
RTF格式可以被Python读取,但我找不到任何方法或库来把RTF文档转换成PDF。
目前我是在微软Word中导出为HTML,替换值后再用PyQt转换成PDF。不过这样会丢失格式,看起来很糟糕。我很惊讶没有一个大家都知道的库,可以让你编辑多种文档格式并转换成其他格式,我是不是漏掉了什么?
更新:谢谢你的建议,我会看看使用Latex。
谢谢,
Jackson