使用json/rdf对象图进行数据集成的库。

jsongraph的Python项目详细描述


#jsongraph[![构建状态](https://travis-ci.org/pudo/jsongraph.svg?branch=master)(https://travis ci.org/pudo/jsongraph)

给定一组异构的源记录,它将生成一组具有来自所有可用源的合并信息的复合实体。此外,它还允许使用
simple查询结果图,基于json的图形查询语言。

此工具的目的是通过简单的json对象无缝提供基于图形的数据集成系统
(基于rdf)。

所有项目信息的图表。这可以由一个
三重存储或一个内存结构来支持。
graph=graph(base_uri='file:///path/to/schema/files')
graph.register('person','person_schema.json')

加载有关个人的数据。
context=graph.context()
context.add('person',,数据)
context.save()
对各种源文件重复数据加载。


“limit”:5}]:
打印项['name']
```

一个“图形”可以只存在于内存中,也可以存储在后端
数据库中。
BR/>在“图表”中的所有数据都被构造为JSON对象的集合(即
嵌套字典、列表和值)。必须使用[json模式](http://json schema.org/)定义所有存储对象
的结构。某些限制
适用于此类架构,例如,它们可能不允许附加或模式属性。


这些
还包括元数据,例如数据源和系统在这些数据中应具有的信任级别。“context”通常对应于源数据文件或用户交互。

然后,他们可以在
单独的“上下文”中生成数据的合并版本。

此合并版本应用实体重复数据消除。对于跨多个“context”具有多个可用值的对象属性
,将选择最可靠的“context”中的信息


这很大程度上受到了google的[metaweb查询语言](http://mql.freebaseapps.com/ch03.html)的启发。
查询被写成json,搜索通过示例进行。搜索也可以是深嵌套的,遍历以任意复杂度存储在“图”中的对象之间的链接。对consolidated
``context``的查询将根据各种来源的数据生成反映最佳可用信息的响应


这将分三步进行:

*为给定的
``graph``中的所有实体生成一组重复数据消除候选对象。这些将是对象的简化表示,可以
输入到比较工具中(自动或与用户交互)。

*一旦确定了候选对象,它们将转换为类型(``original_fingerprint`->;``same_as_fingerprint``)。此类映射
应用于上下文。

*在图形合并(见上文)时,已映射到另一个的实体不包括在内。它们的所有属性都是由目标实体继承的。


“url”:“http://…”
}
}
````

要在安装了“virtualenv`
和“make`”的系统上执行,请键入:

``bash
$make test
``

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java如何通过Intellij的查找功能替换整行代码?   java如何根据语言选择Url?   Java泛型方法无法调用约束更宽松的另一个泛型方法并返回其值   java操作JComboBox   java搜索两个字段匹配的记录   Java中的跳跃算法   用于在对象上添加/删除功能的java范例   java什么是com类文件的修复程序。谷歌。常见的基础找不到谓词?   这个算法的时间复杂度是多少   如何在forEach中执行操作并在Java流中将其传递给groupingBy   在java web应用程序中集成mahout推荐引擎时出现异常   java如何为Alfresco构建metawriter bean?   java循环的最长回文子序列   java如何配置Jitsimeet录制?   为什么java ToCharray语句有时才起作用?   java dependsOnGroups顺序orderTestng   java如何将对象转换为bean   安卓 studio中的java ArrayList<Event>结果大小为0