快速读取Python PDF元数据

2024-06-01 02:16:52 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在寻找一个非常快速、轻量级的Python库来读取PDF元数据。我不需要任何写功能。最好只加载元数据信息,而不是整个文件。

我意识到像Python这样的解释性语言并不是提高速度的最佳选择,但是由于这个解决方案需要跨平台,并且需要与现有的Python应用程序一起工作,因此似乎没有太多的选择。

我查看了pyPdf和其他一些库,但理想的情况是寻找更轻和更快的文件,适合一次性处理数以万计的文件。


Tags: 文件数据功能语言信息应用程序pdf跨平台