如何在Java Web应用程序中将WordML转换为Office Open XML?
我有一个Java的网页应用,它能生成一种叫做WordML格式的MS Word文档(这其实是一个XML文件,属于Word 2003的格式,文件扩展名是.xml
)。我想要把这个文件自动转换成更新的Office Open XML格式,这样就能保存为.docx
文件(其实就是一个包含多个XML文件的压缩包)。
这个过程必须完全自动化,不能让用户手动下载文件再转换。而且我们不能假设用户电脑上安装了MS Word(他们可能在用LibreOffice)。
我一直在找可以用来做这个转换的Java库,但没找到能把.xml
转换成.docx
的库。我找到的唯一一个转换工具是JODconverter,但它不支持从.xml
转换到.docx
。
有没有Java库可以实现这种转换?或者我应该考虑用其他语言的解决方案?比如说Python模块能做到这一点吗?(比如一个Python脚本可以接收Java应用生成的文件,然后转换成.docx
。)
1 个回答
2
如果你无法修改你的应用程序来生成平面 OPC XML格式的文件,你可以写一个 XSLT 来把 Word 2003 的 XML 格式转换成平面 OPC XML。这两种格式其实挺相似的。
然后,docx4j(顺便说一下,我在维护这个工具)可以把平面 OPC XML 转换成 docx 格式。