基于模板的元数据提取器。

nsi.metadataextractor的Python项目详细描述


简介
=

**nsi.metadata extractor**是学术(葡萄牙语)文档的元数据提取程序,例如:

````
课程结论(abnt格式)
事件文章
定期文章


支持的扩展:.pdf
```

setup
=

pip installnsi.metadataextractor



示例
==

**python**


定期

path=“/home/stuff/tccdocument.pdf”
tccExtractor=tcc.tccExtractor(路径)
eventExtractor=event.eventExtractor(路径)
periodiceExtractor=定期.periodicextractor(路径)

tccExtractor.all_metadata()
eventExtractor.all_metadata()
periodicextractor.all_metadata()


**bash**

>;>;提取_metadata/home/stuff/tccdocument.pdf-t tcc
>;>;提取_metadata/home/stuff/eventdocument.pdf-t事件
>;提取元数据/home/stuff/periodicdocument.pdf-t定期

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
javascript如何在jQuery函数中传递两个值,该函数获取数据并使用ajax发送到服务器?   java IOSDriver()不工作。相反,当我在测试用例通过时使用RemoteWebDriver()时,它正在打开远程会话   使用java对blob几何体进行二进制解码   java错误:Gradle:运行在Ubuntu 16.04上的Intellij 2017中的任务执行失败   java Lotus Notes邮件文档获取附件名称(和导出附件)   java如果库有副作用,这样可以吗?   java Javabat帮助:alarmClock   加载类时未初始化java静态变量   java限制htmlunit中的带宽   java Column_layout在安卓 tablelayout中不起作用   java在倒计时和打印循环时遇到问题   虚拟机我需要一个如何访问java虚拟机中的文件的帮助   java图像处理程序中的多线程