pdf解析器和分析器

pdfminer.six-i的Python项目详细描述


Pdfminer的fork使用6实现Python2+3兼容性

pdfminer是从pdf文档中提取信息的工具。 与其他与pdf相关的工具不同,它完全专注于获取和分析 文本数据。pdfminer允许获取页面中文本的准确位置, 以及其他信息,如字体或线条。 它包括一个pdf转换器,可以将pdf文件转换成其他文本 格式(如HTML)。它有一个可扩展的pdf解析器,可以用于 其他目的而不是文本分析。

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java传递位置作为FragmentPagerAdapter中片段的参数   html Java Jsoup循环打印   java如何使用FileOutputStream写入数据而不丢失旧数据?   java在测试用例类/方法中执行sql before/after/in   java在javafx中注册鼠标处理程序,但处理程序不是内联的   Android嵌入了一个C++库的java代码,不需要TopPLE程序来嵌入它?   片段类内部的java ProgressBar导致setMax方法出现NullPointerException?   带有google app engine的java Activator Play框架   java如何解析星级而不是字符串?   java如何在基本实体中定义通用主键字段?   通过扩展实现Java克隆   使用CipherOutputStream的java递归加密提供一个空字节[]   在运行时提取字段值的Java服务   Java 11和spring boot从spring boot应用程序的fat jar中的依赖项jar加载资源   java尝试使用J2SE枚举所有可用的Wifi网络   使用Java库进行SWIFT MT消息解析   java拆分非逗号分隔的字符串   java为什么toString()不能是静态方法?   java在连接到集群数据库时遇到mongo异常   java访问Hashmap中存储的json有效负载值