R ecdf(x)(x)函数的numpy/scipy等价物?

2024-04-25 21:49:44 发布

您现在位置:Python中文网/ 问答频道 /正文

Python中R的ecdf(x)(x)函数在numpy或scipy中是什么等价物?与ecdf(x)(x)基本相同:

import numpy as np
def ecdf(x):
  # normalize X to sum to 1
  x = x / np.sum(x)
  return np.cumsum(x)

还是需要别的东西?

编辑如何控制ecdf使用的存储箱数量?


Tags: to函数importnumpy编辑returndefas
1条回答
网友
1楼 · 发布于 2024-04-25 21:49:44

本文作者有一个非常好的例子,它是用户编写的ECDF函数:John Stachurski's Python lectures。他的系列讲座面向计算经济学的研究生;然而,对于任何学习Python通用科学计算的人来说,它们都是我的热门资源。

编辑:现在已经一岁了,但我想我还是会回答你问题中的“编辑”部分,以防你(或其他人)仍然觉得它有用。

在ECDFs中没有任何“容器”,就像在直方图中一样。如果G是使用数据向量Z形成的经验分布函数,则G(x)实际上是Z<;=x的出现次数除以len(Z)。这不需要“binning”来确定。因此,在某种意义上,ECDF保留了关于数据集的所有可能信息(因为它必须保留整个数据集以进行计算),而直方图实际上通过装箱丢失了关于数据集的一些信息。出于这个原因,我更喜欢在可能的情况下使用ecdfs与直方图。

有趣的好处:如果您需要从非常大的流数据中创建一个类似ECDF的小规模对象,那么您应该查看McDermott等人的这篇“Data Skeletons”文章。

相关问题 更多 >