我一直在寻找一种快速且相对简单的方法来搜索(grep-ish)不同格式的文件中的用户定义字符串,即使用Python的xlsx、docx、pptx、pdf。你知道吗
我的研究使我相信,可能没有一个方便的方法来做到这一点,根据一个单一的模块或类似的。我是否必须为每种文件类型使用单独的模块?如果是这样,这些是否合适?你知道吗
docx公司
openpyxl型
pptx公司
板岩
我还研究了解压的形式,以获取包含实际文本的xml文件,但这似乎很难实现。我只想确保没有简单、统一的方法来处理所有这些不同的文件类型。你知道吗
Tags:
嗯,我基本上都想明白了。最后我决定用powershell和“itextsharp.dll“处理文件。结果证明,它比使用可移植python更简单。谢谢你的邀请答案:-)你知道吗
相关问题 更多 >
编程相关推荐