从pdf/tif文件中提取图像的python包
imgextract的Python项目详细描述
imgextract
这个python包可用于从pdf和tif/tiff文件中提取页面。
这个包使用poppler读取pdf文件和tkinter for gui,因为windows平台poppler已经包含在包中,tkinter可以与python一起安装,但是对于linux,我们必须手动安装它们。
如何安装poppler和tkinter
我们可以从poppler
下载poppler或
我们可以使用下面的命令安装poppler
sudo apt-get install python-poppler
在Linux中使用以下命令安装Tkinter
sudo apt-get update
sudo apt-get install python3-tk
如何使用
pdf页面提取
fromimgextract.imgextimportImgExtractorif__name__=="__main__":ss=ImgExtractor()# input files path, out put files path and file typess.extract("/home/user/pdf_files","/home/user/image_files","pdf")
tif/tiff图像提取
fromimgextract.imgextimportImgExtractorif__name__=="__main__":ss=ImgExtractor()# input files path, out put files path and file typess.extract("/home/user/tif_files","/home/user/image_files","tif")
图像提取图形用户界面
fromimgextract.imgguiimportGuiExtractorif__name__=="__main__":ss=GuiExtractor()ss.openwindow()
安装
$ pip install imgextract