时间序列数据变化检测包
change_detection的Python项目详细描述
处方数据中的变化检测
在r包gets(https://cran.r-project.org/web/packages/gets/index.html)周围使用python包装器检测时间序列中的更改。使用google bigquery和python的组合来查询数据,然后将数据输入r change检测代码。输出包含结果的表。
安装
pip install change_detection
如果尚未安装,anaconda用户可能需要conda install rpy2
和conda install geopandas
。
用法
有关使用示例,请参见https://github.com/ebmdatalab/change_detection/blob/master/examples/examples.ipynb。
数据流
- 通过以下方式获取数据:
- 在
data/<name>
中使用csv,它必须只有字段code
、month
、numerator
和denominator
- 在您正在使用的笔记本所在的文件夹中创建bigquery sql查询时,query必须生成一个表,其中只有字段
code
、month
、numerator
和denominator
- 在bigquery中查询任意数量的openprescribing度量值
- 在
- 使用pandas重塑数据
- 将数据拆分为块并将每个块传递给R更改检测代码
- 然后用进一步的r代码提取结果输出
- 然后将r输出串联起来
输出表
计时措施
is.tfirst
第一个负中断
is.tfirst.pknown
已知干预日期后的第一次阴性中断
is.tfirst.pknown.offs
已知干预日期后的第一个负中断不被xx%的增加所抵消
is.tfirst.offs
第一个负中断不被xx%的增加所抵消
is.tfirst.big
由is.slope.ma
确定的最陡断裂
坡度测量
is.slope.ma
最陡路段的平均坡度至少占总落差的xx%
is.slope.ma.prop
与先前水平成比例的平均斜率
is.slope.ma.prop.lev
用于评估坡度的段占总落差的百分比
水平测量
is.intlev.initlev
下降前水平
is.intlev.finallev
结束级别
is.intlev.levd
前级和结束级之间的差异
is.intlev.levdprop
下降比例
要求
python及其相关的r.python依赖项的安装应该在安装时处理(尽管对于我的安装,我必须单独安装rpy2)。安装R包时应先加载该包。
python安装需要:
- ebmdatalab库https://github.com/ebmdatalab/datalab-pandas
- RPY2(安装R和以下库)
- 熊猫
- 熊猫GBQ
- 努比
R安装要求:
- 动物园
- 卡托尔斯
- 获取