像Max堆和Min堆一样,我希望实现一个中值堆来跟踪给定整数集的中值。API应具有以下三个功能:
insert(int) // should take O(logN)
int median() // will be the topmost element of the heap. O(1)
int delmedian() // should take O(logN)
我想使用数组(a)实现来实现堆,其中数组索引k的子级存储在数组索引2*k和2*k+1中。为了方便起见,数组开始从索引1填充元素。 这就是我目前所拥有的: 中值堆将有两个整数来跟踪到目前为止插入的整数数量,它们是>;当前中值(gcm)和<;当前中值(lcm)。
if abs(gcm-lcm) >= 2 and gcm > lcm we need to swap a[1] with one of its children.
The child chosen should be greater than a[1]. If both are greater,
choose the smaller of two.
另一种情况也是如此。我想不出一个如何沉入和游动元素的算法。我认为应该考虑到这个数字与中位数的接近程度,比如:
private void swim(int k) {
while (k > 1 && absless(k, k/2)) {
exch(k, k/2);
k = k/2;
}
}
但我不能想出完整的解决办法。
下面是一个MedianHeap的java实现,它是在上述coomomocomo的解释的帮助下开发的。
你需要两个堆:一个最小堆和一个最大堆。每个堆包含大约一半的数据。最小堆中的每个元素都大于或等于中值,而最大堆中的每个元素都小于或等于中值。
当最小堆比最大堆多包含一个元素时,中值位于最小堆的顶部。当最大堆比最小堆多包含一个元素时,中值位于最大堆的顶部。
当两个堆包含相同数量的元素时,元素总数是偶数。 在这种情况下,你必须根据你对中位数的定义来选择:a)两个中位数的平均值;b)两个中位数中的较大者;c)较小者;d)随机选择任意一个。。。
每次插入时,都要将新元素与堆顶部的元素进行比较,以确定插入新元素的位置。如果新元素大于当前中值,则它将转到最小堆。如果它小于当前中值,则转到最大堆。那么你可能需要重新平衡。如果堆的大小因多个元素而异,请从包含多个元素的堆中提取最小/最大值,并将其插入到另一个堆中。
为了构造元素列表的中值堆,我们应该首先使用线性时间算法并找到中值。一旦中值已知,我们就可以根据中值向最小堆和最大堆添加元素。不需要平衡堆,因为中值将把元素的输入列表分成相等的两半。
如果提取元素,则可能需要通过将一个元素从一个堆移动到另一个堆来补偿大小更改。这样可以确保,在任何时候,两个堆都具有相同的大小,或者只因一个元素而不同。
完美平衡的二叉搜索树(BST)不是一个中间堆吗?诚然,即使是红黑色的bst也不总是完全平衡的,但它可能足够接近你的目的。日志(n)性能得到保证!
AVL trees比红黑bst更为稳定,因此它们更接近于真正的中间堆。
相关问题 更多 >
编程相关推荐