二叉堆分为两种,最大堆和最小堆,咱们只讨论最小堆的性质,最大堆具备相同的原理。
最小堆是一种符合下面两个特性的树形结构:java
从性质2能够得出一个结论,最小堆的堆顶元素,必定是堆中最小的元素。
最小堆能够支持如下几种基本操做:git
这其中,peek的时间复杂度是O(1)
的,pop和push的操做是O(logN)
的,union操做是O(N+M)
的,其中N和M是堆元素个数。这里先有个概念便可,下面会详细分析这些操做。
由堆的这些性质能够看出来,堆在处理动态数据的时候有很是大的优点,在不少优先级相关的场景下发挥着重大的做用。
堆删除和新增元素后的维护操做,咱们分别称之为shiftUp
和shiftDown
,下图展现了一个最小堆的添加和删除过程。github
shiftDown
操做和添加元素后的
shiftUp
的时间上限和堆的高度有关系,二叉树的高度是
logN
的,因此咱们说堆的pop和push的操做时间复杂度是
O(logN)
的。
谈到树结构,你们可能首先想到的是使用链表的方式存储,确实使用引用关联节点的方式用起来很是灵活。可是对于彻底二叉树来讲,使用数组存储是一种更加优雅的实现方法。一样使用数组实现二叉堆是一种很是经典的实现,下面咱们就来谈谈如何使用数组实现二叉堆的。
先看一幅图算法
左子节点下标 = 自身下标 * 2
,右子节点下标 = 自身下标 * 2 + 1
父节点下标 = 自身下标 / 2
,这里的除是向下取整的。若是你对这个结果持怀疑态度,可使用数学概括法证实一下,也比较简单,这里就不在赘述了
可能你注意到了,数组的起始下标是从1开始的,这也是一种比较经典的实现方式(能够减小计算次数),数组的起始下标从0开始,也有类似的性质。api
解决了存取问题,咱们不妨看一下核心代码的实现数组
我用Java代码实现了一个二叉堆,详细的代码能够在个人GitHub上能够看到,下面是一些核心代码。数据结构
private void shiftUp(final int i) {
for (int c = i; ; ) {
// 取父节点下标p
int p = c >>> 1;
// 若是p<1表示遍历到了堆顶,
// compare(c, p) >= 0表示当前元素大于等于父节点
// 这两种状况都表示堆性质已经恢复,须要跳出循环
if (p < 1 ||
compare(c, p) >= 0) {
break;
}
// 交换两个元素
swap(c, p);
c = p;
}
}
复制代码
private void shiftDown(final int i) {
for (int c = i; ; ) {
// 获取左右子节点下标
int l = c << 1, r = l + 1;
// 右子节点存在,就和两个子节点中较小的比较
if (r <= size) {
int ch = compare(l, r) < 0 ? l : r;
if (compare(c, ch) <= 0) {
break;
}
swap(c, ch);
c = ch;
} else if (l <= size &&
compare(c, l) > 0) {
swap(c, l);
c = l;
} else {
// 循环到底的状况
break;
}
}
}
复制代码
从一个数组构建堆的操做,咱们姑且称之为heapify。一种很容易想到的方法是,直接遍历数组push到一个空堆中,这种作法也有着不错的时间复杂度(O(NlogN))。不过还有更优雅的作法,这种作法的时间复杂度是O(N)的。下面heapify代码很是简单,就是从数组中间向前遍历,依次作shiftDown
操做,为何要从size ÷ 2
开始遍历呢?由于从这个下标开始往前的节点才有孩子节点,此时作shiftDown
是有意义的。这个heapify操做的时间复杂度上界也是O(NlogN)的,不过渐渐时间复杂度是O(N)的,具体证实过程,你们能够参照《算法导论》。字体
private void heapify() {
int lastParent = size >>> 1;
for (int i = lastParent; i >= 1; i--) {
shiftDown(i);
}
}
复制代码
堆是一种应用比较普遍的数据结构,在不少地方都有应用。下面咱们就举两个Java中的例子。spa
java.util.PriorityQueue
和java.util.concurrent.PriorityBlockingQueue
这两种优先级队列都是用堆实现的。DelayedWorkQueue
其实也是一个堆的实现。原创不易,转载请注明出处!www.yangxf.top/线程