Python应该怎么做统计.中位数如何实施?

2024-06-01 01:45:33 发布

您现在位置:Python中文网/ 问答频道 /正文

在新的python3.4中,他们引入了一个新的统计模块。除此之外,它还有一个计算中值的函数。你知道吗

目前,函数首先对数据进行排序,然后确定中间值。 如果你看source code,它包含以下注释:

# FIXME: investigate ways to calculate medians without sorting? Quickselect?

有没有比当前使用的函数更快的方法来计算中值?Python应该实现哪种算法来确定中间值?你知道吗


Tags: 模块to数据函数source排序codewithout
2条回答

您可以使用minmax-median堆来在固定时间内找到min、max和median(并且需要线性时间来构建堆)。如果您想了解有关使用堆获取媒体的更多信息,请阅读这里的min-max heaps

下面是python中的示例代码

最佳中值查找算法需要线性时间,可按以下方式实现: Python implementation of "median of medians" algorithm

对于小数据集,排序和搜索方法可以更快,并减少开销,但这种方法最适合于大数据集。你知道吗

算法如下:http://en.wikipedia.org/wiki/Selection_algorithm

相关问题 更多 >