使用json/rdf对象图进行数据集成的库。
jsongraph的Python项目详细描述
#jsongraph[![构建状态](https://travis-ci.org/pudo/jsongraph.svg?branch=master)(https://travis ci.org/pudo/jsongraph)
给定一组异构的源记录,它将生成一组具有来自所有可用源的合并信息的复合实体。此外,它还允许使用
simple查询结果图,基于json的图形查询语言。
此工具的目的是通过简单的json对象无缝提供基于图形的数据集成系统
(基于rdf)。
所有项目信息的图表。这可以由一个
三重存储或一个内存结构来支持。
graph=graph(base_uri='file:///path/to/schema/files')
graph.register('person','person_schema.json')
加载有关个人的数据。
context=graph.context()
context.add('person',,数据)
context.save()
对各种源文件重复数据加载。
“limit”:5}]:
打印项['name']
```
一个“图形”可以只存在于内存中,也可以存储在后端
数据库中。
BR/>在“图表”中的所有数据都被构造为JSON对象的集合(即
嵌套字典、列表和值)。必须使用[json模式](http://json schema.org/)定义所有存储对象
的结构。某些限制
适用于此类架构,例如,它们可能不允许附加或模式属性。
这些
还包括元数据,例如数据源和系统在这些数据中应具有的信任级别。“context”通常对应于源数据文件或用户交互。
然后,他们可以在
单独的“上下文”中生成数据的合并版本。
此合并版本应用实体重复数据消除。对于跨多个“context”具有多个可用值的对象属性
,将选择最可靠的“context”中的信息
。
这很大程度上受到了google的[metaweb查询语言](http://mql.freebaseapps.com/ch03.html)的启发。
查询被写成json,搜索通过示例进行。搜索也可以是深嵌套的,遍历以任意复杂度存储在“图”中的对象之间的链接。对consolidated
``context``的查询将根据各种来源的数据生成反映最佳可用信息的响应
这将分三步进行:
*为给定的
``graph``中的所有实体生成一组重复数据消除候选对象。这些将是对象的简化表示,可以
输入到比较工具中(自动或与用户交互)。
*一旦确定了候选对象,它们将转换为
类型(``original_fingerprint`->;``same_as_fingerprint``)。此类映射
应用于上下文。
*在图形合并(见上文)时,已映射到另一个的实体不包括在内。它们的所有属性都是由目标实体继承的。
“url”:“http://…”
}
}
````
要在安装了“virtualenv`
和“make`”的系统上执行,请键入:
``bash
$make test
``
给定一组异构的源记录,它将生成一组具有来自所有可用源的合并信息的复合实体。此外,它还允许使用
simple查询结果图,基于json的图形查询语言。
此工具的目的是通过简单的json对象无缝提供基于图形的数据集成系统
(基于rdf)。
所有项目信息的图表。这可以由一个
三重存储或一个内存结构来支持。
graph=graph(base_uri='file:///path/to/schema/files')
graph.register('person','person_schema.json')
加载有关个人的数据。
context=graph.context()
context.add('person',,数据)
context.save()
对各种源文件重复数据加载。
“limit”:5}]:
打印项['name']
```
一个“图形”可以只存在于内存中,也可以存储在后端
数据库中。
BR/>在“图表”中的所有数据都被构造为JSON对象的集合(即
嵌套字典、列表和值)。必须使用[json模式](http://json schema.org/)定义所有存储对象
的结构。某些限制
适用于此类架构,例如,它们可能不允许附加或模式属性。
这些
还包括元数据,例如数据源和系统在这些数据中应具有的信任级别。“context”通常对应于源数据文件或用户交互。
然后,他们可以在
单独的“上下文”中生成数据的合并版本。
此合并版本应用实体重复数据消除。对于跨多个“context”具有多个可用值的对象属性
,将选择最可靠的“context”中的信息
。
这很大程度上受到了google的[metaweb查询语言](http://mql.freebaseapps.com/ch03.html)的启发。
查询被写成json,搜索通过示例进行。搜索也可以是深嵌套的,遍历以任意复杂度存储在“图”中的对象之间的链接。对consolidated
``context``的查询将根据各种来源的数据生成反映最佳可用信息的响应
这将分三步进行:
*为给定的
``graph``中的所有实体生成一组重复数据消除候选对象。这些将是对象的简化表示,可以
输入到比较工具中(自动或与用户交互)。
*一旦确定了候选对象,它们将转换为
类型(``original_fingerprint`->;``same_as_fingerprint``)。此类映射
应用于上下文。
*在图形合并(见上文)时,已映射到另一个的实体不包括在内。它们的所有属性都是由目标实体继承的。
“url”:“http://…”
}
}
````
要在安装了“virtualenv`
和“make`”的系统上执行,请键入:
``bash
$make test
``