看动画轻松理解时间复杂度（二）

时间 2019-11-30

标签动画轻松理解时间复杂度繁體版

原文原文链接

上篇文章讲述了与复杂度有关的大 O 表示法和常见的时间复杂度量级，这篇文章来说讲另外几种复杂度：递归算法的时间复杂度（recursive algorithm time complexity），最好状况时间复杂度（best case time complexity）、最坏状况时间复杂度（worst case time complexity）、平均时间复杂度（average case time complexity）和均摊时间复杂度（amortized time complexity）。算法

递归算法的时间复杂度

若是递归函数中，只进行一次递归调用，递归深度为depth；数组

在每一个递归的函数中，时间复杂度为T；bash

则整体的时间复杂度为O(T * depth)。函数

在前面的学习中，归并排序与快速排序都带有递归的思想，而且时间复杂度都是O(nlogn) ，但并非有递归的函数就必定是 O(nlogn) 级别的。从如下两种状况进行分析。学习

① 递归中进行一次递归调用的复杂度分析

二分查找法

int binarySearch(int arr[], int l, int r, int target){
    if( l > r ) return -1;
    
    int mid = l + (r-l)/2; 
    if( arr[mid] == target ) return mid;  
    else if( arr[mid] > target ) 
    return binarySearch(arr, l, mid-1, target);    // 左边 
    else
    return binarySearch(arr, mid+1, r, target);   // 右边

}
复制代码

好比在这段二分查找法的代码中，每次在 [ l , r ] 范围中去查找目标的位置，若是中间的元素 arr[mid] 不是 target，那么判断 arr[mid]是比 target 大仍是小，进而再次调用 binarySearch这个函数。优化

在这个递归函数中，每一次没有找到target时，要么调用左边的 binarySearch函数，要么调用右边的 binarySearch函数。也就是说在这次递归中，最多调用了一次递归调用而已。根据数学知识，须要log2n次才能递归到底。所以，二分查找法的时间复杂度为 O(logn)。ui

求和

int sum (int n) {
  if (n == 0) return 0;
  return n + sum( n - 1 )
}
复制代码

在这段代码中比较容易理解递归深度随输入 n 的增长而线性递增，所以时间复杂度为 O (n)。spa

求幂

//递归深度：logn
//时间复杂度：O(logn)
double pow( double x, int n){
  if (n == 0) return 1.0;
  
  double t = pow(x,n/2);
  if (n %2) return x*t*t;
  return t * t;
}
复制代码

递归深度为 logn，由于是求须要除以 2 多少次才能到底。code

② 递归中进行屡次递归调用的复杂度分析

递归算法中比较难计算的是屡次递归调用。cdn

先看下面这段代码，有两次递归调用。

// O(2^n) 指数级别的数量级，后续动态规划的优化点
int f(int n){
 if (n == 0) return 1;
 return f(n-1) + f(n - 1);
}
复制代码

递归树中节点数就是代码计算的调用次数。

好比当 n = 3 时，调用次数计算公式为

1 + 2 + 4 + 8 = 15

通常的，调用次数计算公式为

2^0 + 2^1 + 2^2 + ...... + 2^n = 2^(n+1) - 1 = O(2^n)

与之有所相似的是归并排序的递归树，区别点在于

1. 上述例子中树的深度为 n，而归并排序的递归树深度为logn。
1. 上述例子中每次处理的数据规模是同样的，而在归并排序中每一个节点处理的数据规模是逐渐缩小的

所以，在如归并排序等排序算法中，每一层处理的数据量为 O(n) 级别，同时有 logn 层，时间复杂度即是 O(nlogn)。

最好、最坏状况时间复杂度

最好、最坏状况时间复杂度指的是特殊状况下的时间复杂度。

动图代表的是在数组 array 中寻找变量 x 第一次出现的位置，若没有找到，则返回 -1；不然返回位置下标。

int find(int[] array, int n, int x) {
  for (  int i = 0 ; i < n; i++) {
    if (array[i] == x) {
        return i;
        break;
    }
  }
  return -1;
}
复制代码

在这里当数组中第一个元素就是要找的 x 时，时间复杂度是 O(1)；而当最后一个元素才是 x 时，时间复杂度则是 O(n)。

最好状况时间复杂度就是在最理想状况下执行代码的时间复杂度，它的时间是最短的；最坏状况时间复杂度就是在最糟糕状况下执行代码的时间复杂度，它的时间是最长的。

平均状况时间复杂度

最好、最坏时间复杂度反应的是极端条件下的复杂度，发生的几率不大，不能表明平均水平。那么为了更好的表示平均状况下的算法复杂度，就须要引入平均时间复杂度。

平均状况时间复杂度可用代码在全部可能状况下执行次数的加权平均值表示。

仍是以 find 函数为例，从几率的角度看， x 在数组中每个位置的可能性是相同的，为 1 / n。那么，那么平均状况时间复杂度就能够用下面的方式计算：

((1 + 2 + ... + n) / n + n) / 2 = (3n + 1) / 4

find 函数的平均时间复杂度为 O(n)。

均摊复杂度分析

咱们经过一个动态数组的 push_back 操做来理解 均摊复杂度。

template <typename T>
class MyVector{
private:
    T* data;
    int size;       // 存储数组中的元素个数
    int capacity;   // 存储数组中能够容纳的最大的元素个数
    // 复杂度为 O(n)
    void resize(int newCapacity){
        T *newData = new T[newCapacity];
        for( int i = 0 ; i < size ; i ++ ){
              newData[i] = data[i];
            }
        data = newData;
        capacity = newCapacity;
    }
public:
    MyVector(){
        data = new T[100];
        size = 0;
        capacity = 100;
    }
    // 平均复杂度为 O(1)
    void push_back(T e){
        if(size == capacity)
            resize(2 * capacity);
        data[size++] = e;
    }
    // 平均复杂度为 O(1)
    T pop_back(){
        size --;
        return data[size];
    }

};
复制代码

push_back实现的功能是往数组的末尾增长一个元素，若是数组没有满，直接日后面插入元素；若是数组满了，即 size == capacity ，则将数组扩容一倍，而后再插入元素。

例如，数组长度为 n，则前 n 次调用 push_back 复杂度都为 O(1) 级别；在第 n + 1 次则须要先进行 n 次元素转移操做，而后再进行 1 次插入操做，复杂度为 O(n)。

所以，平均来看：对于容量为 n 的动态数组，前面添加元素须要消耗了 1 * n 的时间，扩容操做消耗 n 时间，总共就是 2 * n 的时间，所以均摊时间复杂度为 O(2n / n) = O(2)，也就是 O(1) 级别了。

能够得出一个比较有意思的结论：一个相对比较耗时的操做，若是能保证它不会每次都被触发，那么这个相对比较耗时的操做，它所相应的时间是能够分摊到其它的操做中来的。