在office文档中搜索字符串python

2024-03-29 13:50:54 发布

您现在位置:Python中文网/ 问答频道 /正文

我一直在寻找一种快速且相对简单的方法来搜索(grep-ish)不同格式的文件中的用户定义字符串,即使用Python的xlsx、docx、pptx、pdf。你知道吗

我的研究使我相信,可能没有一个方便的方法来做到这一点,根据一个单一的模块或类似的。我是否必须为每种文件类型使用单独的模块?如果是这样,这些是否合适?你知道吗

docx公司

openpyxl型

pptx公司

板岩

我还研究了解压的形式,以获取包含实际文本的xml文件,但这似乎很难实现。我只想确保没有简单、统一的方法来处理所有这些不同的文件类型。你知道吗


Tags: 模块文件方法字符串用户定义pdf格式
1条回答
网友
1楼 · 发布于 2024-03-29 13:50:54

嗯,我基本上都想明白了。最后我决定用powershell和“itextsharp.dll“处理文件。结果证明,它比使用可移植python更简单。谢谢你的邀请答案:-)你知道吗

相关问题 更多 >