一篇文章让你真正了解快速排序

时间 2019-11-06

标签一篇文章让你真正了解快速排序繁體版

原文原文链接

只要是个工程师，就或多或少的知道快排，其中不少人都能轻松的写出一个快排的实现。可是你们了解阮一峰快排事件吗，是否知道快排的最佳实践？本文从一个争执讲起，经过生动详实的例子让你真正了解快排。嗯，这确实是一篇炒冷饭的文章，但我但愿能把冷饭炒成好吃的蛋炒饭。闲话少叙，立刻开始~

1. 阮一峰快排事件

整个事件用一句话来归纳，就是有人diss阮一峰的快排写的不对，以下图。其实从图上也看到了，这个微博并无发酵起来，直到一篇发表在掘金上的文章《阮一峰版快速排序彻底是错的》（文章已经不能访问），而后又被人提问到知乎上，整个事情才变得热闹了起来。Diss的主要点在于两个：javascript

一个是拿哨兵用的splice而不是数组下标
一个是算法使用的是额外空间而不是原地分割

哨兵：快排中的被选中作为比较对象的基准元素

这件事情上，绝大多数同窗都支持阮老师。其实，我以为这种粗糙的批评是有问题的。有三个缘由：html

1.1 splice已经被说起，而且时间复杂度没有量级上的区别

首先，在阮一峰的快排博客的评论里，他已经提到，splice确实是有问题的，见下图。并且，即便使用了splice，时间复杂度也是O(n)+O(n)=O(n)，在量级上并无影响。
前端

1.2 算法没有规定空间复杂度，而且极端状况下的算法问题是通病

另外，快排在维基（中文|英文）的定义上只规定了时间复杂度，对于空间复杂度的定义是，java

中文：根据实现的方式不一样而不一样
英文： O(n) auxiliary (naive) O(log n) auxiliary

因此用空间复杂度来攻击算法是没有依据的。另外，winter在上面知乎的问题中也说起，原地快排的空间复杂度由于不是尾递归必须用栈，空间复杂度是O(log(n))，而即便快排每次都用新的空间，也无非是O(2n)=O(n)而已。git

固然，如果极端状况下（哨兵每次都把数组分红 n-1和 1个）阮老师的算法中空间复杂度会退化成 O(n的平方)，不过这种状况是非原地快排的通病，而不是阮式算法的特例，因此也不能怪到阮老师头上。

1.3 基于通俗易懂的定位更值得确定

阮老师的博客其实一直是通俗易懂的，我也把通俗易懂做为我本身一直的追求。这个算法可能不是没有瑕疵，可是却绝对称不上错。而咱们作的也不是抨击瑕疵，而是考虑还有哪些改进的方向。es6

阮老师的这个快排实现确实好记，包括我本身，就是经过阮老师的这个算法才算真正记住了快排。在这个基础上，我以为这个微博发的没啥意义。github

2. 快速排序的复杂度分析

前面咱们BB了半天阮一峰快排事件，中间咱们屡次提到了快排的时间复杂度和空间复杂度，在本部分，咱们将分析为何它们是这样的。面试

2.1 时间复杂度

若是足够理想，那咱们指望每次都把数组都分红平均的两个部分，若是按照这样的理想状况分下去，咱们最终能获得一个彻底二叉树。若是排序n个数字，那么这个树的深度就是log2n+1，若是咱们将比较n个数的耗时设置为T(n)，那咱们能够获得以下的公式[1]：算法

T(n) ≤ 2T(n/2) + n，T(1) = 0  
T(n) ≤ 2(2T(n/4)+n/2) + n = 4T(n/4) + 2n  
T(n) ≤ 4(2T(n/8)+n/4) + 2n = 8T(n/8) + 3n  
......
T(n) ≤ nT(1) + (log2n)×n = O(nlogn)

而在最坏的状况下，这个树是一个彻底的斜树，只有左半边或者右半边。这时候咱们的比较次数就变为
=O(n的平方)数组

2.2 空间复杂度

2.2.1 原地排序

原地快排的空间占用是递归形成的栈空间的使用，最好状况下是递归log2n次，因此空间复杂度为O(log2n)，最坏状况下是递归n-1次，因此空间复杂度是O(n)。

2.2.2 非原地排序

对于非原地排序，每次递归都要声明一个总数为n的额外空间，因此空间复杂度变为原地排序的n倍，即最好状况下O(nlog2n)，最差状况下O(n的平方)

对于复杂度这块还想了解更详细内容的同窗能够参考《快速排序复杂度分析》

3. 快排的最佳实践呢

通过上面的部分，想必你对快排在前端的是是非非已经有了一个初步的了解。那么，什么是快排的最佳实践呢？

3.1 最简单好记

这是阮一峰老师的算法实现的变体，由于用了es6的写法，从而使得代码量变得更加精简，主体更加突出。

function quickSortRecursion (arr) {
  if (!arr || arr.length < 2) return arr;
  const pivot = arr.pop();
  let left = arr.filter(item => item < pivot);
  let right = arr.filter(item => item >= pivot);
  return quickSortRecursion(left).concat([pivot], quickSortRecursion(right));
}

3.2 更高的效率

这里贴一个winter的实现，想看更多的实现，能够移步大佬们在github上的互喷地址

function wintercn_qsort(arr, start, end){
    var midValue = arr[start];
    var p1 = start, p2 = end;
    while(p1 < p2) {
        swap(arr, p1, p1 + 1);
        while(compare(arr[p1], midValue) >= 0 && p1 < p2) {
            swap(arr, p1, p2--);
        }
        p1 ++;
    }
    if(start < p1 - 1) 
        wintercn_qsort(arr, start, p1 - 1);
    if(p1 < end) 
        wintercn_qsort(arr, p1, end);
}

3.3 实际状况下的优化方法

刚才也说到，快排实际上是存在最差状况的。实际上，在平常工做中，若是真的有这样大数据量级的优化须要，咱们每每会根据实际状况对快排进行各类各样的优化。

主要的思路有如下几点[3]：

合理选择哨兵，尽可能避免出现斜树
对于重复的元素，一次性的从排来
使用选择排序来处理小数组（V8中设定为10）
使用堆排序来处理最坏状况的分区
用从两边向中间遍从来代替从左向右遍历
使用尾递归
在不一样的线程中并发处理问题

由于本文实在有点长，这块就再也不作详细的阐述，有须要的同窗能够自行参阅《快速排序算法的优化思路总结》。

3.总结

本文从阮一峰快排事件入手，分析了快排在不一样状况下的空间复杂度和时间复杂度，并给出了快排的最佳实践和优化方法。但愿能对你们了解快排有所帮助。