remedian:大数据集的稳健平均

remedian的Python项目详细描述


Build StatuscodecovDocumentation StatusPyPI version

补救

remedian:大型数据集的稳健平均方法-python 实施

该算法用于对几个数据块中值进行近似。 这些数据块不能(或不应该)立即加载到内存中。

给定大小为obs_sizet的数据块,则 remedian类设置长度为n_obs的数组的数目k_arrs

大小{^ }的数据块的中值^ {< CD1>}然后被近似 如下:一个接一个的数据块被送入n_obs位置 第一个数组的。当第一个数组满时,计算其中值 存储在第二个数组的第一个位置。在这之后,第一个 数组用于填充第二个数组的第二个位置等。 当第二个数组已满时,其值的中值存储在 第三个数组的第一个位置,依此类推。

最后一个“remedian”是最后一个数组的中值,毕竟是t数据 已将块输入到对象中。

安装

pip install remedian

依赖项应该由pip自动安装。

最新版本的安装

  1. 激活您的python环境
  2. git clone https://www.github.com/sappelhoff/remedian
  3. cd remedian
  4. pip install -e .
  5. 那么您应该能够from remedian.remedian import Remedian

用法

请参阅example in the docs

参考资料

P.J. Rousseeuw, G.W. Bassett Jr., "The remedian: A robust averaging method for large data sets", Journal of the American Statistical Association, vol. 85 (1990), pp. 97-104

M. Chao, G. Lin, "The asymptotic distributions of the remedians", Journal of Statistical Planning and Inference, vol. 37 (1993), pp. 1-11

Domenico Cantone, Micha Hofri, "Further analysis of the remedian algorithm", Theoretical Computer Science, vol. 495 (2013), pp. 1-16

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java Admob不使用webview   Java Wicket表单:序列化对象类“myClassName”时出错   java googledriveapi更新文件与我的帐户管理员   java简单框架未知xml标记解析   java如何使用主类和用户获取Spark应用程序ID   java如何更改自定义属性的值?   java有没有办法在jMock中找到未使用的期望值?   gradle运行任务的java文档?   java通过使用数组来存储文本文件的行,通过覆盖来删除文本文件中的行   用于表达式语言注入的java利用负载   java IDEStyle程序运行   java在运行时启用/禁用Springws   爪哇芦苇。formatNumber NullPointException   java为什么我的代码无法检测两个动态实体之间的碰撞?