袖珍故事

cubestories的Python项目详细描述


立方窗

cubetories允许通过以python字典(json)的形式提供参数来查询链接的开放统计信息。

支持实施的研究论文

数据存储库的高级封装

测试报告可在以下网址获得:测试报告

安装

pipinstallcubestories

要求将随软件包一起自动安装

导入/使用

fromCubeStoriesimport*

用法

库实现了数据分析所需的3个工件

  • 元数据参数-SPARQL查询所需的元数据
{"sparqlEndPointUrl":"[SPARQL ENDPOINT URL]","jsonMetaDataFile":"[directory of JSON file with metadata]"}
  • 多维数据集参数-从终结点检索多维数据集的哪些属性(基于元数据参数中提供的json文件)。 突出显示为:``--``的值必须由用户指定-替换为仅值
{"cube":"---Key of Cube ---","dimensions":["---List of dimensions---"],"measures":["---List of Measures---"],"hierdimensions":{"---DimKey---":{"selected_level":"---levelkey---"}}
  • 分析管道-要执行的基于json的模式分析列表。每个模式都将提供这样的模板
{"---PatternName---":{"parameter1":["---list of values---"],"parameter2":"---value---"},"---PatternName----":{"parameter1":"---pattern1 value---","parameter2":["---list of values---"]}}

json模板-元数据参数之一

{"---cube_key---":{"title":"---title of cube---","dataset_structure":"---URI for cube structure---","dimensions":{"---dimension_key---":{"dimension_title":"---Title of diemnsion---","dimension_url":"---URI for dimension---","dimension_prefix":"---URI for dimension's values---"},"---dimension_key---":{"dimension_title":"---Title of diemnsion---","dimension_url":"---URI for dimension---","dimension_prefix":"---URI for dimension's values---"}},"hierarchical_dimensions":{"---dimension_key---":{"dimension_title":"---Title of diemnsion---","dimension_url":"---URI for dimension---","dimension_prefix":"---URI for dimension's values---","dimension_levels":{"---level_key---":{"description":"---description of granularity level---","granularity":"---integer level of granularity---"},"---level_key---":{"description":"---description of granularity level---","granularity":"---integer level of granularity---"}}}},"measures":{"---measure_key---":{"measure_title":"---Title of measure---","measure_url":"---URI for measure---"}}}}

模式描述

后面的注释仅用于描述目的。指定管道时删除它们

M计数

测量和计数 应用于整个数据集的算术运算符-有关数据的基本信息

属性

"MeasCount":{"count_type":"count value"}
<表><广告>参数 键入说明 < /广告><正文>计数类型字符串要执行的计数类型

输出

基于count_type值

<表><广告>计数类型 说明 < /广告><正文>原始< /TD>未进行任何分析的数据>< /td>所有数字列的总和平均值所有数字列的平均值 min 所有数值列的最小值 max 所有数值列的最大值计数记录数量

长期有效

leaguetable-排序和提取特定数量的记录

属性

"LeagueTab":{"columns_to_order":["list of columns to order by"],"order_type":"type of order by","number_of_records":5}
<表><广告>参数 键入说明 < /广告><正文>列到列的顺序列表[字符串]要排序的列集合订单类型字符串订单类型(ASC/DESC)记录数整数要检索的记录量

输出

基于排序类型值

<表><广告>排序类型 说明 < /广告><正文> ASC 根据columns_to_order中提供的列升序 说明根据columns_to_order中提供的列降序

内部比较

InternalComparison-一列中与文本值相关的数值比较

属性

"IntComp":{"dim_to_compare":"dimension to compare","meas_to_compare":"measure to compare","comp_type":"comparison type"}
<表><广告>参数 键入说明 < /广告><正文>比较尺寸 字符串维度,将调查哪些值测量到比较 字符串测量,将处理与"dim-to-u比较"相关的数值 补偿类型字符串要执行的比较类型

输出

独立于所选的comp类型,输出数据将有额外的列和数字列以特定方式处理。

可用的比较类型 <表><广告>组件类型 说明 < /广告><正文>diffmax与特定文本值相关的最大值的差异diffmean与特定文本值相关的算术平均值的差异diffmin与特定文本值相关的最小值的差异

剖面异常值

剖面异常值-检测数据中的异常值(异常)

属性

pipinstallcubestories
0 <表><广告>参数 键入说明 < /广告><正文>显示类型字符串将显示哪些信息(有/无异常)

输出

使用python scipy库的模式分析将在一系列数据中执行异常值的快速探索。

根据显示类型,参数数据将显示有/无异常值。

可用的显示类型 <表><广告>显示类型 说明 < /广告><正文>仅限异常值 返回数据集中检测到异常值的行无异常值返回检测到异常值的排除行的数据集

解剖因子

dissectfactors-根据dim_to_dissect中的值分解数据

属性

pipinstallcubestories
1 <表><广告>参数 键入说明 < /广告><正文>从dim到u解剖字符串应基于哪个维度数据进行分解

输出

作为输出,数据将以字典的形式分解,其中每个子集的值仅与特定值相关。 子数据集的字典将被构造为一系列的paiers,其中每个susbet的键的值从dim_到 这个键值将是数据,其中yhis键值是发生的。

高光对比度

HighlightContrast-与一个文本列相关的值之间的部分差异

< H3>属性
pipinstallcubestories
2 <表><广告>参数 键入说明 < /广告><正文>调暗对比度字符串文本列,将从中对比值测量对比度 字符串数值列,数值是对比的对比度类型字符串要呈现的对比度类型

输出

与所选的对比度类型无关,输出数据将有额外的列,其中数字列以特定方式处理。

可用的比较类型 <表><广告>对比度类型 说明 < /广告><正文>部分井与特定文本值相关的最大值的差异最大部分与特定文本值相关的算术平均值的差异部分分钟与特定文本值相关的最小值的差异

开始向下搜索

StartBigDrilldown-从多个层次检索数据。

此模式只能应用于尚未存储在数据框中的数据

属性

pipinstallcubestories
3 <表><广告>参数 键入说明 < /广告><正文>向下钻取框架dict{hierdim:list[str]}带有要检查的层次级别列表的层次维度

输出

作为输出,数据将以字典的形式检索,其中每个数据集将从不同的层次结构级别检索。列表将在hierdim_drill_down中提供。参数中提供的层次结构级别将根据提供的元数据自动按从最一般级别到最详细级别的顺序排序。

启动mallzoomout

startsmallzoomout-从多层次检索数据。

此模式只能应用于尚未存储在数据框中的数据

属性

pipinstallcubestories
4 <表><广告>参数 键入说明 < /广告><正文>屏幕缩小dict{hierdim:list[str]}带有要检查的层次级别列表的层次维度

输出

作为输出,数据将以字典的形式检索,其中每个数据集将从不同的层次结构级别检索。列表将在hierdim_zoom_out中提供。参数中提供的层次结构级别将根据提供的元数据自动按从最详细到最一般的级别进行排序。

按类别分析

AnalysisByCategory—根据Dim_for_类别中的值对数据进行组合,并对每个susbet执行分析

属性

pipinstallcubestories
5 <表><广告>参数 键入说明 < /广告><正文>分类的尺寸字符串维度,根据该维度对输入数据进行分类测量到分析 字符串测量,将对其进行分析 分析类型字符串要执行的分析类型

输出

作为输出,数据将以字典的形式分解,其中每个子集的值仅与特定值相关。该子集将根据analysis_type参数进行分析

可用的分析类型 <表><广告>分析类型 说明 < /广告><正文> min 每个类别的最小值 max 每个类别的最大值平均值每个类别的算术平均值>< /td>每个类别的总价值

explore接口

属性

pipinstallcubestories
6 <表><广告>参数 键入说明 < /广告><正文>从暗到暗浏览字符串维度,将对enpoint中存在的维度进行调查

输出

模式将返回一系列数据集,其中每个数据集将表示在一个立方体中出现的从"dim"到"explore"的

叙述更改超时

表示数据的两个数值性质之间的差异

属性

pipinstallcubestories
7 <表><广告>参数 键入说明 < /广告><正文>测量到叙述字符串一组2个度量值,将叙述这些更改 narr\u类型字符串要执行的叙述类型

输出

独立于所选的"Narr"类型,输出数据将有额外的列,列中的数值以特定方式处理。

可用的分析类型 <表><广告>Narr_类型说明 < /广告><正文>百分比变化第一个和第二个属性之间的百分比变化差异第一和第二属性之间的量化变化

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java广播接收器未检测到按键事件   java不为特定列更改创建修订   java采用了更实用的方法   java桌面窗格HTML呈现   java处理internet连接丢失   java在调整JFrame的大小时,如何防止JTable的列调整大小?   如何用Java中的“Scanner.hasNext”完成程序   具有模块名称的java停止IntelliJ项目工具窗口?   执行已编译的Rails-Warbler JAR文件时发生java加载错误   java Spring数据redis存储库不支持集合查询?   每个客户端的java队列请求   获取Java中的JSON嵌套数组元素   java GWT,Vaadin ConcurrentModificationException   firebase存储中的java在保存照片之前,我需要发送两次照片   JavaSpringEleaf如何在容器外使用变量