逻辑之美(7)_快速排序

时间 2019-11-06

标签逻辑之美快速排序繁體版

原文原文链接

快速排序的高效性依赖于必定的运气成分java

↑这么讲其实不严谨。准确来说，快速排序的高效性依赖于数学几率，且这里的数学几率能够保证——你的电脑在使用快速排序(正确实现的)给一组数据排序时，比插入排序或选择排序要低效的几率比你的电脑此时被闪电击中的几率还要低！算法

因其高效性，快速排序是当下应用最普遍的排序算法。数组

一种应用普遍的算法其效率竟然是靠几率来保证的，听起来可能有点扯，究竟是如何？下面且仔细道来。dom

正文

相比于归并排序，快速排序在保证高效的前提下并不须要那么多的辅助空间(线性级别)，这是它的一大优点。测试

快速排序的最基本算法思路究竟是怎样？优化

快速排序的基本算法

与归并排序相似，快速排序的算法也是一种分而治之的思路。以数组为例，先将数组分红两个子数组，而后分别将两个子数组排序（是不又想到了递归）。与归并排序不一样的是，归并排序将两个子数组排序后还需将两个子数组归并到一块儿，已使数组总体有序。快速排序与之不一样，快速排序中给两个子数组排好序时，原始数组也就天然地总体有序了。ui

特别须要注意的是，快速排序的实现依赖于一个很是重要的切分操做。就是以一个元素(的正确位置)为基准，将原数组切分红两个待排序的子数组，子数组不包含这个切分位置(即不包含此位置上的元素，严格来说原数组被分红了三个子数组！)，左边子数组的元素都不大于此元素的键值，右边子数组的元素都不小于此元素的键值。spa

这意味着什么？这意味着切分位置的元素已经呆在原数组总体有序时它该在的位置了！指针

因此说快速排序中给两个子数组排好序时，原始数组也就天然地总体有序了。code

说这么多，用图片具象化展现下快速排序的过程：

OK 捋完了基本逻辑思路，下面直接上代码来看一种快速排序算法的经典实现。

快速排序的一种经典实现

基于递归的一种经典实现(Java 版本)：

/** * <p>为数组a 的 [start, end] 下标区间原地快速排序的递归实现</p> * @param a：待排序数组 * @param start，排序区间起始下标 * @param end，排序区间终止下标 */
    public static void sortQuick(int[] a, int start, int end){
        if (end <= start){
            return;
        }
        int j = clip(a, start, end);//切分操做完成后，数组 a 的 j 位置已放着总体有序时正确的元素！
        sortQuick_(a, start, j - 1);//将切分位置左边的子数组排序
        sortQuick_(a, j + 1, end);//将切分位置右边的子数组排序
        //数组达到总体有序
    }


/** * <p>快速排序的切分操做，将数组 a 切分为 a[start, j - 1], a[j], [j + 1, end]，返回 j </p> * @param a：待切数组 * @param start，起始下标 * @param end，终止下标 * @return j 切分点下标 */
    public static int clip (int[] a, int start, int end){
        int i = start, j = end + 1;//左右两个扫描数组的指针
        int indexRandom = nextInt(start, end);//[start, end]区间里的一个随机位置
        exch(a, start, indexRandom);//将此随机位置的元素交换到a[start]
        int clip = a[start];//切分元素，取[start, end]区间里的一个随机位置
        while (true){
            //扫描左右两边，并在须要时交换元素
            while (a[++i] < clip){//扫描左边
                if (i == end){
                    break;
                }
            }
            while (a[--j] > clip){//扫描右边
                if (j == start){
                    break;
                }
            }
            if (i >= j){//此条件成立则表示已总体扫描完
                break;
            }
            //i < j 时，交换两个位置的元素
            exch(a, i, j);
        }
        exch(a, start, j);//将clip 放入正确位置 j
        //此时对于数组中的全部元素(键值)，已达成 a[start, j - 1] <= a[j] <= a[j + 1, end]
        return j;
    }


/** * <p>返回 min <= 随机数 <= max 的随机整数数</p> * @param min：min * @param max：max * @return int i：指定闭区间内的随机数 */
    public static int nextInt(int min, int max){
        return min + (int)(Math.random() * (max-min+1));
    }
复制代码

以上代码中最关键的是 clip 方法，最难理解的也是 clip 方法。

其实能够这么理解，每次进行的切分操做都能为原数组排定一个元素(就是那个用来切分的元素)，由于该元素左边的元素(组成的子数组)都不大于它，而右边的元素(组成的子数组)都不小于它，因此此切分元素确定已经在(原数组总体有序时)它该在的位置了。此时若是咱们把切分的左子数组和右子数组都接着排好序那么原数组便达到了总体有序！clip 方法中的两个指针（i 和 j）相遇时咱们将切分元素 a[start] 和当前左子数组最右边一个元素（a[j]）交换而后返回 j 便可。两个指针 i 和 j 会在何时相遇呢？只会有两种状况：

i > j 或者 i == j

这点不难自行概括证实。

另外一种更简洁的实现

其实咱们能够在思惟层面更进一步，上面的实现咱们在 clip 操做里实际上是把原数组分红了三个子数组，左子数组，切分的中间元素（中间数组？），和右子数组。

必需要有这个中间元素吗？我写完上面的代码后突然以为没有这个中间元素好像彻底没问题，甚至能让咱们的代码更简洁！

快速排序是一种分而治之的算法，上面咱们是把原数组分红了三部分，左子数组，切分的中间元素（已在数组总体有序时它该在的位置），右子数组。原问题确实分红了两个更小的子问题（此时把左右数组排好序原数组就总体有序了），这就叫分而治之。从逻辑上来分析，没有中间元素，就单纯的把原数组分红左右两个子数组，只要右子数组里的元素都不小于左子数组里面的元素，把这两个子数组排好序后原数组一样能达到总体有序。这确实是一种更精简的思路，直接来看下实现代码：

/** * <p>为数组a 的 [start, end] 下标区间原地快速排序的非递归实现</p> * @param a：待排序数组 * @param start，排序区间起始下标 * @param end，排序区间终止下标 */
    public static void sortQuick(int[] a, int start, int end){
        if (start >= end){
            return;
        }
        //遍历数组的两个指针，和用于切分数组的元素 clip，此方法将数组 a 切分红两个纯粹的左右子数组，无多余的中间元素
        int i = start, j = end, clip = a[nextInt(start, end)];
        while (i <= j){
            while (a[i] < clip){
                i++;
            }
            while (a[j] > clip){
                j--;
            }
            if (i < j){
                exch(a, i, j);
                i++;
                j--;
            }else if (i == j){
                i++;//或者j--
            }
        }
        /** * ↑捋一下逻辑，上面的循环走完后，j 刚刚比 i 大一 */
        sortQuick(a, start, j);//将左边的子数组排序
        sortQuick(a, i, end);//将右边的子数组排序
        //数组达到总体有序
    }

/** * <p>返回 min <= 随机数 <= max 的随机整数数</p> * @param min：min * @param max：max * @return int i：指定闭区间内的随机数 */
    public static int nextInt(int min, int max){
        return min + (int)(Math.random() * (max-min+1));
    }
复制代码

确实更简洁了~

小结

快速排序的理想状况是每次都恰好将数组对半切分，这样算法运行起来最高效(成本最低)。想要每次都让切分元素都恰好落在数组中间是很难作到的。快速排序实现的一大暗坑就是在切分不平衡时算法可能会极为低效，好比第一次从数组中最小的元素开始切分，第二次从第二小的元素开始切分……这会致使一个大数组须要被切分太屡次。不过咱们上面实现的代码能作到平均而言切分元素都在数组中间，咱们随机选择切分元素的操做就是为使产生糟糕切分的可能性降到很低，尽力避免上述弊端。

总结

以上所述乃是最基本的快速排序，读者还需好好消化吸取一下。快速排序的平均时间复杂度为线性对数级别的 O(n log n)，所需的空间复杂度根据具体实现的不一样加以区别，如咱们上述的实现只需常数级别的辅助空间。特别注意对于很差的实现，快速排序最坏须要平方级别的时间复杂度。

上述分析其实不够立体，对于一些典型用例，快速排序是要比咱们以前文章里讨论的排序算法都要快的，这点读者不妨本身写些测试用例实际跑跑对比看看其余排序算法。

固然以上所述只是最基本的快速排序，其还有很大改进空间，例如针对含有大量重复元素数组优化的三向切分的快速排序算法。针对基本快速排序算法的改进暂不在本文讨论范围，之后有机会能够单发篇文章好好聊聊此方面。

系列文章至此，主流几种排序算法已所有讲完，下篇聊啥呢？