微软PowerPoint Python解析器
我在找一个可以用Python处理微软Office文件的工具,特别是PowerPoint文件。
我想用Python来解析PPT文件,提取里面的文字和图片。
有没有这样的库可以使用呢?
2 个回答
3
你可能会找到这样的东西,但我敢打赌这很难;因为你在寻找两种稀有的特性。
你可以考虑使用 Open Office 的开发工具包,它已经有很多现成的功能可以用来读取PowerPoint文件,你可以利用这些功能来实现你的目的。虽然这些都是用Java写的,而不是Python,但我猜学习Java的难度要比弄明白如何读取PowerPoint文件要小得多。
5
我觉得没有这样的库。
你可以使用 pywin32 这个包来访问PowerPoint的COM接口。
这里有一篇很不错的介绍,讲的是如何使用win32com模块来自动化PowerPoint的任务,作者写得很好:http://www.s-anand.net/blog/automating-powerpoint-with-python/