算法导论读书笔记(7)
快速排序
快速排序是一种原地排序算法,对包含 n 个数的输入数组,最坏状况运行时间为 Θ ( n2 )。虽然这个最坏状况运行时间比较差,但快速排序一般是用于排序的最佳的实用选择。这是由于其平均性能至关好:指望的运行时间为 Θ ( n lg n ),且 Θ ( n lg n )记号中隐含的常数因子很小。java
像合并排序同样,快速排序也是基于分治模式的。下面是对一个子数组 A [ p .. r ]排序的分治过程的三个步骤:算法
- 分解:
- 数组 A [ p .. r ]被划分红两个(可能为空)子数组 A [ p .. q - 1 ]和 A [ q + 1 .. r ],使得 A [ p .. q - 1 ]中的每个元素都小于等于 A [ q ],并且,小于等于 A [ q + 1 .. r ]中的元素。下标 q 也在这个划分过程当中计算。
- 解决:
- 经过递归调用快速排序,对子数组 A [ p .. q - 1 ]和 A [ q + 1 .. r ]排序。
- 合并:
- 由于两个子数组是就地排序的,将它们合并不须要操做,整个数组 A [ p .. r ]已排序。
下面的过程实现了快速排序:sql
QUICK-SORT(A, p, r) 1 if p < r 2 q = PARTITION(A, p, r) 3 QUICK-SORT(A, p, q - 1) 4 QUICK-SORT(A, q + 1, r)
快速排序算法的关键是 PARTITION
过程,它对子数组 A [ p .. r ]进行就地重排:数组
PARTITION(A, p, r) 1 x = A[r] 2 i = p - 1 3 for j = p to r - 1 4 if A[j] <= x 5 i = i + 1 6 exchange A[i] with A[j] 7 exchange A[i + 1] with A[r] 8 return i + 1
PARTITION
老是选择一个 x = A [ r ]做为 主元 (pivot element),并围绕它来划分子数组。在第3行到第6行中循环的每一轮迭代开始时,对于任何数组下标 k ,有bash
- 若是 p <= k <= i ,则 A [ k ] <= x
- 若是 i + 1 <= k <= j - 1,则 A [ k ] > x
- 若是 k = r ,则 A [ k ] = x
下图总结了这一结构。过程 PARTITION
做用于子数组 A [ p .. r ]后获得四个区域。 A [ p .. i ]中的各个值都小于等于 x , A [ i + 1 .. j - 1 ]中的值都大于 x , A [ r ] = x 。 A [ j .. r - 1 ]中的值能够是任何值。dom
快速排序的简单Java实现
private static int partition(int[] array, int p, int r) { int x = array[r]; int i = p - 1; for (int j = p; j < r; j++) if (array[j] < x) { i++; AlgorithmUtil.swap(array, i, j); } AlgorithmUtil.swap(array, i + 1, r); return i + 1; }
/** * 快速排序 */ public static void quickSort(int[] array) { quickSort(array, 0, array.length - 1); } private static void quickSort(int[] array, int p, int r) { if (p < r) { int q = partition(array, p, r); quickSort(array, p, q - 1); quickSort(array, q + 1, r); } }
快速排序的性能
快速排序的运行时间与划分是否对称有关,然后者又与选择了哪个元素来进行划分有关。若是划分是对称的,那么本算法从渐近意义上来说,就和归并排序算法同样快;若是划分是不对称的,那么本算法渐近上就和插入排序同样慢。ide
最坏状况划分
快速排序的最坏状况划分发生在划分过程产生的两个区域分别包含 n - 1个元素和1个0元素的时候。假设算法的每一次递归调用都出现了这种不对称划分。划分的时间代价为 Θ ( n )。对一个大小为0的数组进行递归调用后,返回 T ( 0 ) = Θ ( 1 ),故算法的运行时间为 T ( n ) = T ( n - 1 ) + Θ ( n )。最终获得解为 T ( n ) = Θ ( n2 )。post
最佳状况划分
在 PARTITION
过程可能的最平衡划分中,一个子问题的大小为 FLOOR(n / 2)
,另外一个子问题的大小为 CEIL(n / 2)
- 1。这种状况下,其运行时间的递归式为 T ( n ) <= 2 T ( n / 2 ) + Θ ( n )。该递归式的解为 T ( n ) = O ( n lg n )。性能
快速排序的随机化版本
随机划分使用 随机取样 (random sampling)的随机化技术,从子数组 A [ p .. r ]中随机选择一个元素并与 A [ r ]互换,由于主元是随机选择的,咱们指望在平均状况下,对输入数组的划分可以比较对称。测试
RANDOMIZED-PARTITION(A, p, r) 1 i = RANDOM(p, r) 2 exchange A[r] with A[i] 3 return PARTITION(A, p, r)
比较排序
以前已经介绍了几种能在 O ( n lg n )时间内排序 n 个数的算法。好比归并排序,堆排序和快速排序。这些算法都有一个相同的性质:排序结果中,各元素的次序基于输入元素间的比较。这类排序算法统称为 比较排序 。
在一个比较排序算法中,仅用比较来肯定输入序列< a1 , a2 , …, an >的元素间次序。就是说,给定两个元素 ai 和 aj ,测试 ai < aj , ai <= aj , ai = aj , ai >= aj 或 ai > aj 中的哪个成立,以肯定 ai 和 aj 之间的相对次序。
比较排序能够被抽象地视为 决策树 。一棵决策树是一棵满二叉树,表示某排序算法做用于给定输入所作的全部比较,而控制结构,数据移动等都被忽略了。下图是插入排序做用于含三个元素的输入序列上的决策树。
在决策树中,对每一个内结点都注明 i : j ,其中1 <= i , j <= n , n 是输入序列中的元素个数。对每一个叶结点都注明排列< π ( 1 ), π ( 2 ), …, π ( n )>。排序算法的执行对应于遍历一条从树根到叶结点的路径。在每一个内结点处都要作比较。当到达一个叶结点是,排序算法就肯定了顺序。要使排序算法能正确地工做,其必要条件是, n 个元素的 n! 中排列中的每一种都要做为决策树的一个叶子出现。