用Python读取WordPerfect文件?
我真的需要处理一些包含在WordPerfect 12文件中的信息,但又不想使用WordPerfect那种慢吞吞的界面。不过,我找不到关于这种文件格式的详细文档,也没有找到可以用来读取或写入这些文件的Python模块。我在网上找到了一篇帖子,似乎讲解了如何把WordPerfect文件转换成文本,但我对它的工作原理不是很明白。
http://mail.python.org/pipermail/python-list/2000-February/023093.html
我该怎么做呢?
3 个回答
2
我觉得OpenOffice.org应该能够打开WordPerfect文件。
而且你可以用Python来编写OpenOffice的脚本。
3
你链接中相关的部分是这个:
os.system( "%s %s %s" % ( WPD_TO_TEXT_CMD, "/tmp/tmpfile", "/tmp/tmpfile.txt" ) )
这段代码是在调用一个外部程序,叫做“wp2txt”。在网上搜索这个程序可以找到很多相关的信息。
1
好的,我来讲讲我做了什么。我以二进制模式读取了文件,把里面的数据转换成了十六进制的字符串表示。然后,我参考了一些非官方的WordPerfect文档,使用了正则表达式来替换掉所有代表非文本格式的十六进制字符串和元数据。最后,我把所有内容又转换回了文本。
这算是一种比较粗糙的黑客手法,但最终达到了目的。