通过OCG从PDF中提取几何元素（按层）

2条回答

网友

1楼 · 编辑于 2024-04-26 09:33:44

PDF文档由两种“类型”的数据组成。文档有一个面向对象的“结构”，可以将文档划分为页面，并携带元数据（例如，有一个可选内容组列表），还有一个面向流的标记运算符列表，这些运算符实际上将内容“绘制”到页面上。在

事实上，存在OCG及其名称，以及关于它们的一些信息都存储在面向对象的内容中，并且可以通过相当容易地解析对象内容来提取。但是OCG的成员关系并不存储在对象结构中。它只能通过解析内容流找到。当内容运算符/OC/选项contentgroupnameBDC前接运算符EMC时，标记运算符组是特定OCG组的成员。在

解析内容流是一项不那么简单的任务。有很多工具可以帮你做到这一点。我本人不会试图从头开始构建这样一个解析器。重写轮子没有什么价值。在

PDF的完整语法可从许多来源获得。在网上搜索“PDF规范1.7”或“ISO32000-1:2008”。这是一个令人望而生畏的文档，但它确实提供了创建和对象以及内容解析器所需的所有信息

网友

2楼 · 编辑于 2024-04-26 09:33:44

如果您的PDF是在OGC层中组织的，那么您可以使用gdal_translate命令GDAL。在

使用以下命令检查PDF文件中所有可用的OGC层：

gdalinfo "sample.pdf" -mdd LAYERS

然后，使用以下to命令提取分区层：

^{pr2}$

更多细节请参考here。在

相关问题更多 >

编程相关推荐

热门问题

热门文章