plone的文件到内容元数据更新
collective.filemeta的Python项目详细描述
背景信息
例如,当MS Office或PDF文档作为普通文件内容存储在Plone中时, 不使用文档中嵌入的文档元数据。这样的元数据被嵌入 在文件中以各种类型特定的格式显示,可能包括以下信息 标题、说明和关键字,或图像的exif/iptc元数据。普隆也没有提供 文档的屏幕截图或封面缩略图
这个包旨在以一种通用的、可插入的方式提供那些缺少的特性
注意,除了这个包之外,还需要其他包来提供实际的 文件类型特定的元数据提取,例如:
- products.openxml for MS Office文档支持
- 用于PDF支持的collective.pdfdocument
提供的功能
- 从不同文件类型检索元数据的通用可插入机制,更新 满足它,甚至将元数据从plone content返回到文件, 如果需要
- 按内容类型切换机制的行为
- 一个可选的“文档文件”灵活的内容类型示例,该类型获取其元数据和 自动从上载的文档文件复制封面图像
- 可选增强的内置文件内容类型,以便更新元数据 来自上传的文件(包括封面图片)
- 更好的默认视图(用于示例类型和增强文件)
未提供的功能
- 查看文档内容
- 文档的索引(虽然很适合)
- 异步操作
有关元数据和封面图像的说明
通常人们不需要为文档元数据操心,所以在上传之前,您应该检查 文档属性。
对于MS Office文档,请确保在保存之前选择了“存储预览”选项 文件PDF没有嵌入的封面图像;对于它们,collective.pdfdocument 将PDF的第一页转换为PNG封面图像。
实施说明
元数据由订阅服务器处理,该订阅服务器尝试使用名称与主文件字段mime类型匹配的“ifilemetaprovider”实用程序检索元数据。如果 元数据可以从文件中提取,它由另一个“icontmetaupdater”复制过来 (同样命名)效用
安装
通过将collective.filemeta添加到构建中来安装它:
[buildout] ... eggs = collective.filemeta
然后运行bin/buildout。记住,你还需要一些额外的 提供文档文件元数据的特定于文件类型提取的包为了 MS Office OpenXML和PDF支持,构建将具有:
[buildout] ... eggs = collective.filemeta Products.OpenXml collective.pdfdocument
贡献
支架
如果您有问题,请提交给tracker或与作者联系
1.0RC3(2016-06-08)
- 添加样式设置的css类
1.0rc2(2016-06-07)
- 始终覆盖objectaddedevent上的元数据
1.0RC1(2016-06-03)
- 在没有图像字段的内容类型上设置行为时不中断 [培养基]
- 其他小修 [培养基]
1.0a1(未发布)
- 初次发布。 [培养基]