将非结构化文档集合转换为结构化链接数据

ferenda的Python项目详细描述


ferende是一个用于转换的python库和框架 将非结构化文档集合转换为结构化链接数据。它 有助于下载文档,解析文档以添加显式 语义结构和基于rdf的元数据,查找关系 在文档之间,并发布结果,包括通过 基于rest的http api。

https://badge.fury.io/py/ferenda.pnghttps://travis-ci.org/staffanm/ferenda.png?branch=masterhttps://ci.appveyor.com/api/projects/status/aqdo3c39cdof8opa/branch/masterhttps://coveralls.io/repos/staffanm/ferenda/badge.png?branch=masterCode Healthhttps://pypip.in/d/ferenda/badge.png

快速启动

本例使用Ferenda的项目框架下载 最新的RFC和W3C标准,将文档解析为结构化的, 启用rdf的xhtml文档,将所有rdf元数据加载到一个triplestore中 并生成可使用的静态HTML5文件的网站 脱机:

pip install ferenda
ferenda-setup myproject
cd myproject
./ferenda-build.py ferenda.sources.tech.RFC enable
./ferenda-build.py ferenda.sources.tech.W3Standards enable
./ferenda-build.py all all --downloadmax=50 --staticsite --fulltextindex=False
open data/index.html

如果 你想把Ferenda作为更大系统的一部分。也有可能 只使用你需要的部分(如 下载和解析功能)。

更多信息

有关详细文档,请参见http://ferenda.readthedocs.org/

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
如何加载。java文件到编译器?   java写入文件和I/O   java日历返回错误的当前日期安卓   if语句if变量等于1(java)   java很难让Joda有时间使用我的bukkit插件   json如何创建基于java的应用程序,该应用程序将从网站获取输入   java如何在多页中打印大型JPanel   java my spinner在添加从firebase数据库中选择的多个值时被覆盖   java用Play框架覆盖HTTP方法   试图获取所有用户时,java错误请求400。Dto和表格   java支持bean加载图像后javascript自动调用JS函数   java在MTOM的@StreamingAttachment(Metro)中,Parsely的意思是什么   具有可抢占线程队列的多线程java执行器   Java Opencv connectedComponentsWithStats   java如何向数组中添加2D数组的数目   eclipse为什么我的Java Zork克隆不能正确循环?   java在哪里放置定制的第二个web。xml   java如何更改最近应用列表中显示的快照?   java Browser#getText()返回空字符串