堆排序、胜者树、败者树,孰优孰劣?

在顺序存储结构中,堆排序是一种很是不错的高级选择排序算法,普通状况和最差状况下均可以将时间复杂度控制在O(n * logn)。算法

堆排序能够用在顺序存储结构,是由于彻底二叉树的一种独特性质。而这里还要先提一下满二叉树。函数

啥叫满二叉树?满二叉树是这样一种二叉树,它的每一层都是“满”的,设根部为第0层,则每一层都有2^n个节点。全部节点的度数要么是2,要么是0(叶子)。指针

那彻底二叉树呢?咱们首先作出以下规定,即对二叉树中的节点,按从根部到叶子、每层从左到右递增的编号;若是某棵树,其全部节点的编号都与一颗具备相同层数的满二叉树对应节点的编号一一对应,则称这棵树是彻底二叉树。code

显而易见,彻底二叉树不算最下面一层,必然是一颗满二叉树————而且最下面一层必定是从左到右连续完好口的。排序

由于彻底二叉树和满二叉树的编号是一一对应的,且各层的节点个数也是很是明确的,由于咱们就能够将彻底二叉树(毫无疑问满二叉树必然是彻底二叉树)保存为顺序存储结构。这是由于任意节点知道其偏移量以后,理论上均可以计算出其父、其子的偏移量。基础

那么咱们就计算一下吧。二叉树

设有节点,其位于第n层(从根到叶,根层编号为0),第k个(从左到右,最左边编号为0);所以n和k也能够理解为其以前的节点层数/节点个数。设其偏移量函数为P(n,k)时间

那么咱们知道在以前有n层,每层i都是满的,有2^i个节点。co

P(n,k)=2^0+2^1+...+2^(n-1)+k

等比序列啊,易得,P(n,k)=2^n+k-1。

好,那么该节点的孩子的编号的,层数确定是n+1,该节点以前的节点都有两个孩子,因此孩子的行编号必然是2 * k和2 * k + 1。 也就是P(n+1, 2 * k)和P(n+1, 2 * k + 1)

P(n+1, 2 * k)=2^(n+1)+2*k-1=2 * (2^n+k-1)+1=2 * P(n,k)+1
P(n+1, 2 * k + 1)=2^(n+1)+2*k=2 * (2^n+k-1)+2=2 * P(n,k)+2

因而咱们知道一个节点,若是其偏移量为d,则其子节点的偏移量为2 * d + 1和2 * d + 2。

反过来推算,很容易知道其父节点的偏移量为 (d-1)/2。

如上所述,这就表示,咱们能够用顺序存储表示一课彻底二叉树,并能够很方便的计算出任意节点的父节点和子节点。

在此基础上,咱们就能够进行堆排序了。堆排序很简单,就是首先向单元素堆不断追加叶子节点,同时调整以保持堆特性,待到将全部节点(在顺序存储中就是各个元素了)都加入堆后,根据堆的性质在堆的根部必然是极值,而后将极值与末端的叶子节点交换,丢掉该叶子,而且从根部调整堆以保持对特性,而后不断重复这个过程,直到堆变成单元素堆,结束。

我为何要提堆呢?咱们能够看到堆排序的后半部分算法中,就是一个很明确的“多个值中选取极值,取出该极值,更新根、而后修复堆”的过程。

这个过程彻底能够套用到多路归并排序中,无非是堆排序把末端节点丢了,而多路归并无丢弃末端节点(即堆的长度未改变)。

可是这里就有个问题——对堆进行修复时,每层调整都要对三个值(父节点、两个子节点)进行至少两次比较。

那么为了减小比较的消耗,人们就发展出胜者树来——胜者树让全部参与排序的序列提出的值都做为叶子,而后在其上面补充节点成为彻底二叉树,父节点会保存两个子节点比较时的胜者。

这样就让每层只需比较一次(和兄弟比较便可)。

但是仍是有人不满意,因而又弄出了败者树,败者树和胜者树的结构基本一致,只是父节点保存的不是胜者而是败者,而且额外有个指针保存当前的胜者(修正完毕后天然就是最后胜者了)。

败者树比胜者树好在哪?

胜者树的话,从叶子到根的过程当中,每一层都要和兄弟进行比较,而后把胜者付赋给父节点。

而败者树,从叶子到根的过程当中,每一层只需和父节点进行比较(该叶子更新前能够胜出,全部其常胜——因此其各级父节点保管的必然是与其竞争并失败的兄弟节点),而后败者赋给父节点,胜者继续向上走。

其实差距不太大,节省了一次寻址。

通常一个有n个待排序列的话,构造败者树或者胜者树是,树的大小为2 * n - 1。败者树、胜者树与彻底二叉树堆同样都要先进行调整,此时应从后向前调整。有兴趣能够本身算算。

相关文章
相关标签/搜索