从当前目录递归更改文件和目录的权限和所有者

pdf2odt的Python项目详细描述


什么是pdf2odt

这是一个将pdf转换为libreoffice writer文档的脚本。PDF页面转换为图像。它使用来自poppler的pdftoppm进行转换

在Linux中安装和使用

如果使用gentoo,可以在https://github.com/Turulomio/myportage/tree/master/dev-python/pdf2odt中找到ebuild

要在其他发行版中安装,必须安装poppler才能使用pdftoppm命令。您可以使用您的分发包管理器

然后键入:

pip安装pdf2odt

安装后,您可以使用它键入:

pdf2odt–pdf doc.pdf doc.odt

如果需要OCR,则必须安装Tesseract应用程序,然后才能运行

pdf2odt–pdf doc.pdf–tesseract doc.odt

在Windows中安装和使用

您需要安装python。它适用于最新版本。不要忘记将python可执行文件添加到path,并在安装过程中标记它。

然后键入:

pip安装pdf2odt

现在您必须从https://blog.alivate.com.au/poppler-windows/下载poppler for windows。解压缩下载的文件并将其安装目录添加到windows环境路径。在这里,您可以使用https://www.architectryan.com/2018/03/17/add-to-the-path-on-windows-10/

现在您可以使用它在windows shell中键入:

pdf2odt–pdf doc.pdf doc.odt

如果你想要ocr,你必须从mhttps://github.com/UB-Mannheim/tesseract/wiki下载tesseract for windows。然后还必须将其安装目录添加到windows环境路径中。

pdf2odt–pdf doc.pdf–tesseract doc.odt

依赖关系

更改日志

0.6.0

  • Tesseract language is now showed in output
  • Now pdf2odt validates PDF document

0.5.0

  • Now pdf2odt detects if tesseract language selected is supported.

0.4.0

  • Added OCR support with tesseract
  • Now uses process concurrency and shows a progress bar

0.3.0

  • Fixed problem with white spaces paths in windows.
  • Improved metadata information.

0.2.0

  • Now works on Windows with popper for windows installation

0.1.0

  • Basic functionality

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java使用tomcat时,如何加载JDBC驱动程序?   Spring数据Rest中嵌套资源的java分页   java从ImagesService创建URL需要多长时间。getServingUrl last   java的纸牌游戏战争与处理   内存不足的java解释探查器输出:PermGen空间错误   如何在java代码中等待scala的未来   java在安卓studio中通过if-else子句后,如何访问变量的新值   javascript DHTMLX甘特API   意图启动期间的java运行时异常   Java中的用户界面复合组件   java Hibernate更新调用在@OneToOne映射中生成新行   正则表达式在N个数的序列中计数零   java设置在何处查找audit4j的配置文件   maven JSR352:Annotation@Named在JavaSE中不起作用   java以更实用的方式对目录进行分组   JavaEclipse不再打开   java机器人按键VK_控件在Macbook上工作?   java如何等待所有线程完成执行?