创建一个可以在浏览器中显示doc、docx、pdf的系统
我现在正在开发一个网页应用,它是一个FTP服务器的前端。这个服务器里有几千个pdf、doc和docx文件,每个月还会增加几十个,有时甚至接近一百个。
我们现在的应用使用OpenOffice把文件转换成pdf格式。然后我们用pdf2swf把这些pdf文件转换成swf格式,这样就可以在浏览器里显示了。在新的应用中,所有的数据都在FTP服务器上,我们不能存储或创建swf文件。
我们需要先找到服务器上某个资源的链接,然后把它下载到另一台机器上,再在浏览器中显示这个文档。
有没有什么方法(最好是用python)可以比较快地生成swf文件,以满足我们的需求呢?
一个更好的解决方案可能是类似于谷歌文档查看器的API,但不幸的是,他们的服务条款不允许这样使用: “您不能使用该服务开发一个视觉文档搜索和预览应用,该应用在单个网页中嵌入多个Google文档查看器的使用,针对DOC、DOCX或PPTX文件类型。”
1 个回答
2
如果你想处理PDF文件,可以试试Mozilla团队做的一个完整的JavaScript实现,叫做 pdf.js。你只需要把pdf.js的文件和你的PDF文件放在Python服务器上就可以了 :)
对于doc或docx文件,你可以使用 OpenOffice工具把它们转换成PDF格式。然后再转换回去 :)(如果你想自己写这部分,unoconv是用Python写的,并且使用 Python-UNO桥接)