从PDF中提取数据并导出到ex

2024-05-19 01:05:17 发布

您现在位置:Python中文网/ 问答频道 /正文

几个月后,我为自动化下一个过程编写了脚本。在

  1. 在文件夹中列出.pdf文件。在
  2. 从每个pdf文件中提取数据
  3. 将提取的数据保存在excel表格中

脚本工作完美时,处理多达15个pdf文件,但如果我尝试与更多不工作。我想在第三个过程中崩溃,但我不能确定。在

我编写检查点(打印找到的文件数、打印提取的数据等),但为了能够保存不间断的空间数据,我需要输入以下代码:

import sys
reload(sys)  
sys.setdefaultencoding('Cp1252')

当我把这些行放到pythonshell中时,我看不到任何东西,所以我不知道脚本什么时候崩溃。在

我想也许是关于记忆的问题,但我需要你的帮助。在

如果您能检查我的代码并给我建议,我将不胜感激

谢谢

我所有的脚本:

^{pr2}$

Tags: 文件数据代码import脚本文件夹pdf过程

热门问题