最长递增子序列

问题

给定一个长度为N的数组,找出一个最长的单调自增子序列(不必定连续,可是顺序不能乱)。例如:给定一个长度为6的数组A{5, 6, 7, 1, 2, 8},则其最长的单调递增子序列为{5,6,7,8},长度为4.ios

解法1:最长公共子序列法

这个问题能够转换为最长公共子序列问题。如例子中的数组A{5,6, 7, 1, 2, 8},则咱们排序该数组获得数组A‘{1, 2, 5, 6, 7, 8},而后找出数组A和A’的最长公共子序列便可。显然这里最长公共子序列为{5, 6, 7, 8},也就是原数组A最长递增子序列。最长公共子序列算法在算法导论上有详细讲解,这里简略说下思想。算法

假定两个序列为X={x1, x2, ..., xm}和Y={y1, y2, ..., yn),并设Z={z1, z2, ..., zk}为X和Y的任意一个LCS。数组

1)若是xm = yn,则zk = xm=yn,且Zk-1是Xm-1和Yn-1的一个LCS。测试

2)若是xm != yn, 则zk != xm蕴含Z是Xm-1和Y得一个LCS。优化

3)若是xm != yn, 则zk != yn蕴含Z是X和Yn-1的一个LCS。spa

解法2:动态规划法(时间复杂度O(N^2))

设长度为N的数组为{a0,a1, a2, ...an-1),则假定以aj结尾的数组序列的最长递增子序列长度为L(j),则L(j)={ max(L(i))+1, i<j且a[i]<a[j] }。也就是说,咱们须要遍历在j以前的全部位置i(从0到j-1),找出知足条件a[i]<a[j]的L(i),求出max(L(i))+1即为 L(j)的值。最后,咱们遍历全部的L(j)(从0到N-1),找出最大值即为最大递增子序列。时间复杂度为O(N^2)。排序

例如给定的数组为{5,6,7,1,2,8},则L(0)=1, L(1)=2, L(2)=3, L(3)=1, L(4)=2, L(5)=4。因此该数组最长递增子序列长度为4,序列为{5,6,7,8}。算法代码以下:rem

Cpp代码   收藏代码
  1. #include <iostream>  
  2. using namespace std;  
  3. #define len(a) (sizeof(a) / sizeof(a[0])) //数组长度  
  4. int lis(int arr[], int len)  
  5. {  
  6.     int longest[len];  
  7.     for (int i=0; i<len; i++)  
  8.         longest[i] = 1;  
  9.   
  10.     for (int j=1; j<len; j++) {  
  11.         for (int i=0; i<j; i++) {  
  12.             if (arr[j]>arr[i] && longest[j]<longest[i]+1){ //注意longest[j]<longest[i]+1这个条件,不能省略。  
  13.                 longest[j] = longest[i] + 1; //计算以arr[j]结尾的序列的最长递增子序列长度  
  14.             }  
  15.         }  
  16.     }  
  17.   
  18.     int max = 0;  
  19.     for (int j=0; j<len; j++) {  
  20.         cout << "longest[" << j << "]=" << longest[j] << endl;  
  21.         if (longest[j] > max) max = longest[j];  //从longest[j]中找出最大值  
  22.     }  
  23.     return max;  
  24. }  
  25.   
  26. int main()  
  27. {  
  28.     int arr[] = {1, 4, 5, 6, 2, 3, 8}; //测试数组  
  29.     int ret = lis(arr, len(arr));  
  30.     cout << "max increment substring len=" << ret << endl;  
  31.     return 0;  
  32. }  


解法3:O(NlgN)算法

假设存在一个序列d[1..9] ={ 2,1 ,5 ,3 ,6,4, 8 ,9, 7},能够看出来它的LIS长度为5。
下面一步一步试着找出它。
咱们定义一个序列B,而后令 i = 1 to 9 逐个考察这个序列。
此外,咱们用一个变量Len来记录如今最长算到多少了

首先,把d[1]有序地放到B里,令B[1] = 2,就是说当只有1一个数字2的时候,长度为1的LIS的最小末尾是2。这时Len=1

而后,把d[2]有序地放到B里,令B[1] = 1,就是说长度为1的LIS的最小末尾是1,d[1]=2已经没用了,很容易理解吧。这时Len=1

接着,d[3] = 5,d[3]>B[1],因此令B[1+1]=B[2]=d[3]=5,就是说长度为2的LIS的最小末尾是5,很容易理解吧。这时候B[1..2] = 1, 5,Len=2

再来,d[4] = 3,它正好加在1,5之间,放在1的位置显然不合适,由于1小于3,长度为1的LIS最小末尾应该是1,这样很容易推知,长度为2的LIS最小末尾是3,因而能够把5淘汰掉,这时候B[1..2] = 1, 3,Len = 2

继续,d[5] = 6,它在3后面,由于B[2] = 3, 而6在3后面,因而很容易能够推知B[3] = 6, 这时B[1..3] = 1, 3, 6,仍是很容易理解吧? Len = 3 了噢。

第6个, d[6] = 4,你看它在3和6之间,因而咱们就能够把6替换掉,获得B[3] = 4。B[1..3] = 1, 3, 4, Len继续等于3

第7个, d[7] = 8,它很大,比4大,嗯。因而B[4] = 8。Len变成4了

第8个, d[8] = 9,获得B[5] = 9,嗯。Len继续增大,到5了。

最后一个, d[9] = 7,它在B[3] = 4和B[4] = 8之间,因此咱们知道,最新的B[4] =7,B[1..5] = 1, 3, 4, 7, 9,Len = 5。

因而咱们知道了LIS的长度为5。

注意,这个1,3,4,7,9不是LIS,它只是存储的对应长度LIS的最小末尾。有了这个末尾,咱们就能够一个一个地插入数据。虽然最后一个d[9] = 7更新进去对于这组数据没有什么意义,可是若是后面再出现两个数字 8 和 9,那么就能够把8更新到d[5], 9更新到d[6],得出LIS的长度为6。

而后应该发现一件事情了:在B中插入数据是有序的,并且是进行替换而不须要挪动——也就是说,咱们可使用二分查找,将每个数字的插入时间优化到O(logN)~~~~~因而算法的时间复杂度就下降到了O(NlogN)~!string

代码以下(代码中的数组B从位置0开始存数据):it

Cpp代码   收藏代码
    1. #include <stdio.h>  
    2. #include <stdlib.h>  
    3. #include <string.h>  
    4.   
    5. #define N 9 //数组元素个数  
    6. int array[N] = {2, 1, 6, 3, 5, 4, 8, 7, 9}; //原数组  
    7. int B[N]; //在动态规划中使用的数组,用于记录中间结果,其含义三言两语说不清,请参见博文的解释  
    8. int len; //用于标示B数组中的元素个数  
    9.   
    10. int LIS(int *array, int n); //计算最长递增子序列的长度,计算B数组的元素,array[]循环完一遍后,B的长度len即为所求  
    11. int BiSearch(int *b, int len, int w); //作了修改的二分搜索算法  
    12.   
    13. int main()  
    14. {  
    15.     printf("LIS: %d\n", LIS(array, N));  
    16.   
    17.     int i;  
    18.     for(i=0; i<len; ++i)  
    19.     {  
    20.         printf("B[%d]=%d\n", i, B[i]);  
    21.     }  
    22.   
    23.     return 0;  
    24. }  
    25.   
    26. int LIS(int *array, int n)  
    27. {  
    28.     len = 1;  
    29.     B[0] = array[0];  
    30.     int i, pos = 0;  
    31.   
    32.     for(i=1; i<n; ++i)  
    33.     {  
    34.         if(array[i] > B[len-1]) //若是大于B中最大的元素,则直接插入到B数组末尾  
    35.         {  
    36.             B[len] = array[i];  
    37.             ++len;  
    38.         }  
    39.         else  
    40.         {  
    41.             pos = BiSearch(B, len, array[i]); //二分查找须要插入的位置  
    42.             B[pos] = array[i];  
    43.         }  
    44.     }  
    45.   
    46.     return len;  
    47. }  
    48.   
    49. //修改的二分查找算法,返回数组元素须要插入的位置。  
    50. int BiSearch(int *b, int len, int w)  
    51. {  
    52.     int left = 0, right = len - 1;  
    53.     int mid;  
    54.     while (left <= right)  
    55.     {  
    56.         mid = left + (right-left)/2;  
    57.         if (b[mid] > w)  
    58.             right = mid - 1;  
    59.         else if (b[mid] < w)  
    60.             left = mid + 1;  
    61.         else    //找到了该元素,则直接返回  
    62.             return mid;  
    63.     }  
    64.     return left;//数组b中不存在该元素,则返回该元素应该插入的位置  
相关文章
相关标签/搜索