有没有一种程序化的方法来确定PDF的文本是否可以使用Python提取？

2024-04-19 09:32:37 发布

男 | 程序猿一只，喜欢编程写python代码。

我花了45分钟想弄清楚为什么pyPdf

PageObject.getPage(x).extractText())

什么都没有提取。最后，我给了它一个不同的PDF文件，它工作得很好，这导致我得出结论，原来的PDF文件有某种（非密码）的保护。在Adobe Reader中确认“页面提取：不允许。”

如果可以的话，我如何通过编程来确定是否存在这种保护？在

Tags：文件密码 pdf 编程页面 reader adobe pypdf

1条回答

网友

1楼 · 发布于 2024-04-19 09:32:37

这可能符合您的要求。在

x = PageObject.getPage(x).extractText())
if (x == ""): #Or whatever exactly you get when it fails.
   raise ValueError("The PDF file can not be imported")

编程相关推荐

Java重写
java有一种制作jre1的方法。8作为jre1运行。7.
java从Android应用程序向AWS S3上传文件
java是一种正确的匿名子类化TimerTask的方法，在run方法中保留对“this”的引用
c#应用程序开发：我应该检查表上的primarykey还是假设它应该在那里？
swing在Java中绘制二叉树如何调用函数
网络编程在Java中通过按钮终止服务器程序
mysql从java创建SQL函数导致异常
java文件系统找不到指定的路径
JavaSpring安全性可用于GET，但不能用于其他方法

有没有一种程序化的方法来确定PDF的文本是否可以使用Python提取？

相关问题更多 >

编程相关推荐

热门问题

热门文章

有没有一种程序化的方法来确定PDF的文本是否可以使用Python提取？

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >