数据结构与算法-学习笔记(九)

线性排序

桶排序、计数排序、基数排序这三种排序算法由于时间复杂度是O(n)线性的,所以把这类排序算法叫作线性排序。他们是非基于比较的排序算法。算法

这种排序算法对排序的数据要求很苛刻,主要掌握他们的适用场景。数组

桶排序

  1. 若是要排序的数据有n个,把n个数据均匀分到m个桶内,每一个桶内有k=n/m个元素。
  2. 每一个桶内的数据使用快排,时间复杂度O(klogk)。m个桶的总时间O(mklogk)。k=n/m =>O(nlog(n/m))。
  3. 当桶的个数m无限接近数据个数n时,log(n/m)就是个很是小的常量,此时时间复杂度=O(n);

以上,能够看出实际使用桶排序时,须要数据在各个桶间分布均匀,若是某些桶内数据很是多,某些又不多,则每一个桶内数据排序的时间复杂度就不是很是小的常量了。在极端状况下,全部数据都进到一个桶内,O(nlogn);bash

适用状况

外部排序:数据存储在外部磁盘中,数据量大,内存有限,没法将数据所有加载到内存。ui

此时使用桶排序,就能够将数据按照桶的顺序,一桶桶加载到内存进行排序。spa

计数排序

能够当作一种特殊的桶排序,它先找到数据的最大值k(也就是数据的范围),而后将数据划分到k个桶内。则每一个桶内的数据值都是相等的,省了桶内排序的时间。code

可是具体计算,不是直接将数据存入桶内,而是将数据的个数放入桶内,再用计数的方式算出位置。cdn

// 计数排序,a 是数组,n 是数组大小。假设数组中存储的都是非负整数。
public void countingSort(int[] a, int n) {
  if (n <= 1) return;

  // 查找数组中数据的范围
  int max = a[0];
  for (int i = 1; i < n; ++i) {
    if (max < a[i]) {
      max = a[i];
    }
  }

  int[] c = new int[max + 1]; // 申请一个计数数组 c,下标大小 [0,max]
  for (int i = 0; i <= max; ++i) {
    c[i] = 0;
  }

  // 计算每一个元素的个数,放入 c 中
  for (int i = 0; i < n; ++i) {
    c[a[i]]++;
  }

  // 依次累加
  for (int i = 1; i <= max; ++i) {
    c[i] = c[i-1] + c[i];
  }

  // 临时数组 r,存储排序以后的结果
  int[] r = new int[n];
  // 计算排序的关键步骤,有点难理解
  for (int i = n - 1; i >= 0; --i) {
    int index = c[a[i]]-1;
    r[index] = a[i];
    c[a[i]]--;
  }

  // 将结果拷贝给 a 数组
  for (int i = 0; i < n; ++i) {
    a[i] = r[i];
  }
}
复制代码

综上,计数排序只能用在数据范围不大的场景中,若是数据最大范围K比数据量n大不少,就会有不少空桶,不适用。且计数排序只能给非负整数排序,若是数据是其余类型,能够在不改变相对大小的状况下,转化为非负整数。blog

基数排序

相似对手机号码这样的数据排序,由于数据范围大因此桶排序和计数都不行。排序

基数排序:按照每一位数据进行稳定排序。内存

每一位排序可使用桶排序或计数,则时间复杂度O(n)。排序数据有k为=O(kn),若是k较小,则接近O(n);

若是不是等长的数据能够补齐,如用‘0’这样不影响原有大小顺序的数据。

综上:基数排序要求数据能够分割出独立的‘位’来比较,且位之间有递进关系(如:个十百位)。同时,每一位的数据范围不要太大,要可使用线性排序算法来排序。不然时间复杂度就达不到n了。

相关文章
相关标签/搜索