齐姐漫画:排序算法(三)之「快排」

算法

首先选一个基准 pivot,而后过一遍数组,java

  • 把小于 pivot 的都挪到 pivot 的左边,
  • 把大于 pivot 的都挪到 pivot 的右边。

这样一来,这个 pivot 的位置就肯定了,也就是排好了 1 个元素。算法

而后对 pivot 左边 👈 的数排序,
对 pivot 右边 👉 的数排序,
就完成了。数组

那怎么排左边和右边?dom

答:一样的方法。ui

因此快排也是用的分治法的思想。spa

「分」

选择一个 pivot,就把问题分红了指针

  • pivot 左边
  • pivot 右边

这两个问题。code

「治」

就是最开始描述的方法,直到每一个区间内没有元素或者只剩一个元素就能够返回了。blog

「合」

放在一块儿天然就是。排序

可是如何选择这个 pivot?

取中间的?

取第一个?

取最后一个?

举个例子:{5, 2, 1, 0, 3}.

好比选最后一个,就是 3.

而后咱们就须要把除了 3 以外的数分红「比 3 大」和「比 3 小」的两部分,这个过程叫作 partition(划分)

这里咱们仍然使用「挡板法」的思想,不用真的弄两个数组来存这两部分,而是用两个挡板,把区间划分好了。

咱们用「两个指针」(就是挡板)把数组分红「三个区间」,那么

  • 左边的区间用来放小于 pivot 的元素;
  • 右边的区间用来放大于 pivot 的元素;
  • 中间是未排序区间。

那么初始化时,咱们要保证「未排序区间」可以包含除了 3 以外的全部元素,因此

  • 未排序区间 = [i, j]

这样左边和右边的区间就成了:

  • [0, i):放比 3 小的数;
  • (j, array.length -2]:放比 3 大的数

注意 ⚠️ i, j 是不包含在左右区间里的呢。

那咱们的目的是 check 未排序区间里的每个数,而后把它归到正确的区间里,以此来缩小未排序区间,直到没有未排序的元素。

从左到右来 check:

Step1.

5 > 3, 因此 5 要放在右区间里,因此 5 和 j 指向的 0 交换一下:

这样 5 就排好了,指针 j --,这样咱们的未排序区间就少了一个数;

Step2.

0 < 3,因此就应该在左边的区间,直接 i++;

Step3.

2 < 3,同理,i++;

Step4.

1 < 3,同理,i++;

因此当两个指针错位的时候,咱们结束循环。

可是还差了一步,3 并不在正确的位置上呀。因此还要把它插入到两个区间中间,也就是和指针 i 交换一下。

齐姐声明:这里并不鼓励你们把 pivot 放最左边。

基本全部的书上都是放右边,既然放左右都是同样的,咱们就按照你们默认的、达成共识的来,不必去“标新立异”。

就好比围棋的四个星位,可是讲究棋道的就是先落本身这边的星位,而不是伸着胳膊去够对手那边的。

那当咱们把 pivot 换回到正确的位置上来以后,整个 partition 就结束了。

以后就用递归的写法,对左右两边排序就行了。

最后还有两个问题想和你们讨论一下:

  1. 回到咱们最初选择 pivot的问题,每次都取最后一个,这样作好很差?

答:并很差。

由于咱们是想把数组分割的更均匀均匀的时间复杂度更低;可是若是这是一个有序的数组,那么老是取最后一个是最不均匀的取法。

因此应该随机取 pivot,这样就避免了由于数组自己的特色老是取到最值的状况。

  1. pivot 放在哪

随机选取以后,咱们仍是要把这个 pivot 放到整个数组的最右边,这样咱们的未排序区间才是连续的,不然每次走到 pivot 这里还要想着跳过它,心好累哦。

class Solution {
  public void quickSort(int[] array) {
    if (array == null || array.length <= 1) {
      return;
    }
    quickSort(array, 0, array.length - 1);
  }
  private void quickSort(int[] array, int left, int right) {
    // base case
    if (left >= right) {
      return;
    }

    // partition
    Random random = new Random(); // java.util 中的随机数生成器
    int pivotIndex = left + random.nextInt(right - left + 1);
    swap(array, pivotIndex, right);

    int i = left;
    int j = right-1;
    while (i <= j) {
      if (array[i] <= array[right]) {
        i++;
      } else {
        swap(array, i, j);
        j--;
      }
    }
    swap(array, i, right);

    //「分」
    quickSort(array, left, i-1);
    quickSort(array, i+1, right);
  }
  private void swap(int[] array, int x, int y) {
    int tmp = array[x];
    array[x] = array[y];
    array[y] = tmp;
  }
}

这里的时空复杂度和分的是否均匀有很大关系,因此咱们分状况来讲:

1. 均分

时间复杂度

若是每次都能差很少均匀分,那么

  • 每次循环的耗时主要就在这个 while 循环里,也就是 O(right - left);
  • 均分的话那就是 logn 层;
  • 因此总的时间是 O(nlogn).

空间复杂度

  • 递归树的高度是 logn,
  • 每层的空间复杂度是 O(1),
  • 因此总共的空间复杂度是 O(logn).

2. 最不均匀

若是每次都能取到最大/最小值,那么递归树就变成了这个样子:

时间复杂度

如上图所示:O(n^2)

空间复杂度

这棵递归树的高度就变成了 O(n).

3. 总结

实际呢,大多数状况都会接近于均匀的状况,因此均匀的状况是一个 average case.

为何看起来最好的状况其实是一个平均的状况呢?

由于即便若是没有取到最中间的那个点,好比分红了 10% 和 90% 两边的数,那其实每层的时间仍是 O(n),只不过层数变成了以 9 为底的 log,那总的时间仍是 O(nlogn).

因此快排的平均时间复杂度是 O(nlogn)。

稳定性

那你应该能看出来了,在 swap 的时候,已经破坏了元素之间的相对顺序,因此快排并不具备稳定性。

这也回答了咱们开头提出的问题,就是

  • 为何对于 primitive type 使用快排

    • 由于它速度最快;
  • 为何对于 object 使用归并

    • 由于它具备稳定性且快。

以上就是快排的全部内容了,也是很常考的内容哦!那下一篇文章我会讲几道从快排引伸出来的题目,猜猜是什么?😉

相关文章
相关标签/搜索