横断面和时间序列数据插补算法
impyute的Python项目详细描述
导入
impyute是一个缺失数据插补算法库。这个图书馆被设计成超轻的,这里有一个潜峰在什么样的impyute可以做。
>>>n=5>>>arr=np.random.uniform(high=6,size=(n,n))>>>for_inrange(3):>>>arr[np.random.randint(n),np.random.randint(n)]=np.nan>>>print(arr)array([[0.25288643,1.8149261,4.79943748,0.54464834,np.nan],[4.44798362,0.93518716,3.24430922,2.50915032,5.75956805],[0.79802036,np.nan,0.51729349,5.06533123,3.70669172],[1.30848217,2.08386584,2.29894541,np.nan,3.38661392],[2.70989501,3.13116687,0.25851597,4.24064355,1.99607231]])>>>importimpyuteasimpy>>>print(impy.mean(arr))array([[0.25288643,1.8149261,4.79943748,0.54464834,3.7122365],[4.44798362,0.93518716,3.24430922,2.50915032,5.75956805],[0.79802036,1.99128649,0.51729349,5.06533123,3.70669172],[1.30848217,2.08386584,2.29894541,3.08994336,3.38661392],[2.70989501,3.13116687,0.25851597,4.24064355,1.99607231]])
功能支持
- 横断面数据的估算
- K-近邻
- 用链式方程进行多元插补
- 期望最大化
- 平均插补
- 模式插补
- 中值插补
- 随机插补
- 时间序列数据的插补
- 最后一次观察结果结转
- 移动窗口
- 自回归综合移动平均(WIP)
- 诊断工具
- 伐木工人
- 空值分布
- 估算值比较
- Little's MCAR测试(WIP)
版本
目前在2.7、3.4、3.5、3.6和3.7上测试
安装
要安装impyute,请运行以下命令:
$ pip install impyute
或获取最新版本:
$ git clone https://github.com/eltonlaw/impyute
$ cd impyute
$ python setup.py install