转【算法之动态规划（二）】动态规划：重新手到专家

时间 2019-12-13

标签算法之动态规划（二）动态规划重新手到专家繁體版

原文原文链接

前言

咱们遇到的问题中，有很大一部分能够用动态规划(简称DP)来解。解决这类问题能够很大地提高你的能力与技巧，我会试着帮助你理解如何使用DP来解题。这篇文章是基于实例展开来说的，由于干巴巴的理论实在很差理解。php

注意：若是你对于其中某一节已经了解而且不想阅读它，不要紧，直接跳过它便可。ios

简介(入门)

什么是动态规划，咱们要如何描述它?算法

动态规划算法一般基于一个递推公式及一个或多个初始状态。当前子问题的解将由上一次子问题的解推出。使用动态规划来解题只须要多项式时间复杂度，所以它比回溯法、暴力法等要快许多。数组

如今让咱们经过一个例子来了解一下DP的基本原理。ui

首先，咱们要找到某个状态的最优解，而后在它的帮助下，找到下一个状态的最优解。spa

“状态”表明什么及如何找到它?.net

“状态"用来描述该问题的子问题的解。原文中有两段做者阐述得不太清楚，跳过直接上例子。翻译

若是咱们有面值为1元、3元和5元的硬币若干枚，如何用最少的硬币凑够11元？ (表面上这道题能够用贪心算法，但贪心算法没法保证能够求出解，好比1元换成2元的时候)code

首先咱们思考一个问题，如何用最少的硬币凑够i元(i<11)？为何要这么问呢？两个缘由：1.当咱们遇到一个大问题时，老是习惯把问题的规模变小，这样便于分析讨论。 2.这个规模变小后的问题和原来的问题是同质的，除了规模变小，其它的都是同样的，本质上它仍是同一个问题(规模变小后的问题实际上是原问题的子问题)。blog

好了，让咱们从最小的i开始吧。当i=0，即咱们须要多少个硬币来凑够0元。因为1，3，5都大于0，即没有比0小的币值，所以凑够0元咱们最少须要0个硬币。 (这个分析很傻是否是？别着急，这个思路有利于咱们理清动态规划究竟在作些什么。) 这时候咱们发现用一个标记来表示这句“凑够0元咱们最少须要0个硬币。”会比较方便，若是一直用纯文字来表述，不出一下子你就会以为很绕了。那么，咱们用d(i)=j来表示凑够i元最少须要j个硬币。因而咱们已经获得了d(0)=0，表示凑够0元最小须要0个硬币。当i=1时，只有面值为1元的硬币可用，所以咱们拿起一个面值为1的硬币，接下来只须要凑够0元便可，而这个是已经知道答案的，即d(0)=0。因此，d(1)=d(1-1)+1=d(0)+1=0+1=1。当i=2时，仍然只有面值为1的硬币可用，因而我拿起一个面值为1的硬币，接下来我只须要再凑够2-1=1元便可(记得要用最小的硬币数量)，而这个答案也已经知道了。因此d(2)=d(2-1)+1=d(1)+1=1+1=2。一直到这里，你均可能会以为，好无聊，感受像作小学生的题目似的。由于咱们一直都只能操做面值为1的硬币！耐心点，让咱们看看i=3时的状况。当i=3时，咱们能用的硬币就有两种了：1元的和3元的( 5元的仍然没用，由于你须要凑的数目是3元！5元太多了亲)。既然能用的硬币有两种，我就有两种方案。若是我拿了一个1元的硬币，个人目标就变为了：凑够3-1=2元须要的最少硬币数量。即d(3)=d(3-1)+1=d(2)+1=2+1=3。这个方案说的是，我拿3个1元的硬币；第二种方案是我拿起一个3元的硬币，个人目标就变成：凑够3-3=0元须要的最少硬币数量。即d(3)=d(3-3)+1=d(0)+1=0+1=1. 这个方案说的是，我拿1个3元的硬币。好了，这两种方案哪一种更优呢？记得咱们但是要用最少的硬币数量来凑够3元的。因此，选择d(3)=1，怎么来的呢？具体是这样获得的：d(3)=min{d(3-1)+1, d(3-3)+1}。

OK，码了这么多字讲具体的东西，让咱们来点抽象的。从以上的文字中，咱们要抽出动态规划里很是重要的两个概念：状态和状态转移方程。

上文中d(i)表示凑够i元须要的最少硬币数量，咱们将它定义为该问题的"状态"，这个状态是怎么找出来的呢？我在另外一篇文章动态规划之背包问题(一)中写过：根据子问题定义状态。你找到子问题，状态也就浮出水面了。最终咱们要求解的问题，能够用这个状态来表示：d(11)，即凑够11元最少须要多少个硬币。那状态转移方程是什么呢？既然咱们用d(i)表示状态，那么状态转移方程天然包含d(i)，上文中包含状态d(i)的方程是：d(3)=min{d(3-1)+1, d(3-3)+1}。没错，它就是状态转移方程，描述状态之间是如何转移的。固然，咱们要对它抽象一下，

d(i)=min{ d(i-v_j)+1 }，其中i-v_j >=0，v_j表示第j个硬币的面值;

有了状态和状态转移方程，这个问题基本上也就解决了。固然了，Talk is cheap,show me the code!

伪代码以下：

下图是当i从0到11时的解：

从上图能够得出，要凑够11元至少须要3枚硬币。

此外，经过追踪咱们是如何从前一个状态值获得当前状态值的，能够找到每一次咱们用的是什么面值的硬币。好比，从上面的图咱们能够看出，最终结果d(11)=d(10)+1(面值为1)，而d(10)=d(5)+1(面值为5)，最后d(5)=d(0)+1 (面值为5)。因此咱们凑够11元最少须要的3枚硬币是：1元、5元、5元。

注意：原文中这里原本还有一段的，但我反反复复读了几遍，大概的意思我已经在上文从i=0到i=3的分析中有所体现了。做者原本想讲的通俗一些，结果没写好，反而更很差懂，因此这段不翻译了。

初级

上面讨论了一个很是简单的例子。如今让咱们来看看对于更复杂的问题，如何找到状态之间的转移方式(即找到状态转移方程)。为此咱们要引入一个新词叫递推关系来将状态联系起来(说的仍是状态转移方程)

OK，上例子，看看它是如何工做的。

一个序列有N个数：A[1],A[2],…,A[N]，求出最长非降子序列的长度。 (讲DP基本都会讲到的一个问题LIS：longest increasing subsequence)

正如上面咱们讲的，面对这样一个问题，咱们首先要定义一个“状态”来表明它的子问题，而且找到它的解。注意，大部分状况下，某个状态只与它前面出现的状态有关，而独立于后面的状态。

让咱们沿用“入门”一节里那道简单题的思路来一步步找到“状态”和“状态转移方程”。假如咱们考虑求A[1],A[2],…,A[i]的最长非降子序列的长度，其中i<N，那么上面的问题变成了原问题的一个子问题(问题规模变小了，你可让i=1,2,3等来分析) 而后咱们定义d(i)，表示前i个数中以A[i]结尾的最长非降子序列的长度。OK，对照“入门”中的简单题，你应该能够估计到这个d(i)就是咱们要找的状态。若是咱们把d(1)到d(N)都计算出来，那么最终咱们要找的答案就是这里面最大的那个。状态找到了，下一步找出状态转移方程。

为了方便理解咱们是如何找到状态转移方程的，我先把下面的例子提到前面来说。若是咱们要求的这N个数的序列是：

5，3，4，8，6，7

根据上面找到的状态，咱们能够获得：（下文的最长非降子序列都用LIS表示）

前1个数的LIS长度d(1)=1(序列：5)
前2个数的LIS长度d(2)=1(序列：3；3前面没有比3小的)
前3个数的LIS长度d(3)=2(序列：3，4；4前面有个比它小的3，因此d(3)=d(2)+1)
前4个数的LIS长度d(4)=3(序列：3，4，8；8前面比它小的有3个数，因此 d(4)=max{d(1),d(2),d(3)}+1=3)

OK，分析到这，我以为状态转移方程已经很明显了，若是咱们已经求出了d(1)到d(i-1)，那么d(i)能够用下面的状态转移方程获得：

d(i) = max{1, d(j)+1},其中j<i,A[j]<=A[i]

用大白话解释就是，想要求d(i)，就把i前面的各个子序列中，最后一个数不大于A[i]的序列长度加1，而后取出最大的长度即为d(i)。固然了，有可能i前面的各个子序列中最后一个数都大于A[i]，那么d(i)=1，即它自身成为一个长度为1的子序列。

分析完了，上图：(第二列表示前i个数中LIS的长度，第三列表示，LIS中到达当前这个数的上一个数的下标，根据这个能够求出LIS序列)

Talk is cheap, show me the code:

#include <iostream> using namespace std; int lis(int A[], int n){ int *d = new int[n]; int len = 1; for(int i=0; i<n; ++i){ d[i] = 1; for(int j=0; j<i; ++j) if(A[j]<=A[i] && d[j]+1>d[i]) d[i] = d[j] + 1; if(d[i]>len) len = d[i]; } delete[] d; return len; } int main(){ int A[] = { 5, 3, 4, 8, 6, 7 }; cout<<lis(A, 6)<<endl; return 0; }

该算法的时间复杂度是O(n² )，并非最优的解法。还有一种很巧妙的算法能够将时间复杂度降到O(nlogn)，网上已经有各类文章介绍它，这里就再也不赘述。传送门： LIS的O(nlogn)解法。此题还能够用“排序+LCS”来解，感兴趣的话可自行Google。

练习题

无向图G有N个结点(1<N<=1000)及一些边，每一条边上带有正的权重值。找到结点1到结点N的最短路径，或者输出不存在这样的路径。

提示：在每一步中，对于那些没有计算过的结点，及那些已经计算出从结点1到它的最短路径的结点，若是它们间有边，则计算从结点1到未计算结点的最短路径。

尝试解决如下来自topcoder竞赛的问题：

ZigZag – 2003 TCCC Semifinals 3
BadNeighbors – 2004 TCCC Round 4
FlowerGarden – 2004 TCCC Round 1

中级

接下来，让咱们来看看如何解决二维的DP问题。

平面上有N＊M个格子，每一个格子中放着必定数量的苹果。你从左上角的格子开始，每一步只能向下走或是向右走，每次走到一个格子上就把格子里的苹果收集起来，这样下去，你最多能收集到多少个苹果。

解这个问题与解其它的DP问题几乎没有什么两样。第一步找到问题的“状态”，第二步找到“状态转移方程”，而后基本上问题就解决了。

首先，咱们要找到这个问题中的“状态”是什么？咱们必须注意到的一点是，到达一个格子的方式最多只有两种：从左边来的(除了第一列)和从上边来的(除了第一行)。所以为了求出到达当前格子后最多能收集到多少个苹果，咱们就要先去考察那些能到达当前这个格子的格子，到达它们最多能收集到多少个苹果。 (是否是有点绕，但这句话的本质实际上是DP的关键：欲求问题的解，先要去求子问题的解)

通过上面的分析，很容易能够得出问题的状态和状态转移方程。状态S[i][j]表示咱们走到(i, j)这个格子时，最多能收集到多少个苹果。那么，状态转移方程以下：

S[i][j]=A[i][j] + max(S[i-1][j], if i>0 ; S[i][j-1], if j>0)

其中i表明行，j表明列，下标均从0开始；A[i][j]表明格子(i, j)处的苹果数量。

S[i][j]有两种计算方式：1.对于每一行，从左向右计算，而后从上到下逐行处理；2. 对于每一列，从上到下计算，而后从左向右逐列处理。这样作的目的是为了在计算S[i][j]时，S[i-1][j]和S[i][j-1]都已经计算出来了。

伪代码以下：

如下两道题来自topcoder，练习用的。

AvoidRoads – 2003 TCO Semifinals 4
ChessMetric – 2003 TCCC Round 4

中高级

这一节要讨论的是带有额外条件的DP问题。

如下的这个问题是个很好的例子。

无向图G有N个结点，它的边上带有正的权重值。

你从结点1开始走，而且一开始的时候你身上带有M元钱。若是你通过结点i，那么你就要花掉S[i]元(能够把这想象为收过路费)。若是你没有足够的钱，就不能从那个结点通过。在这样的限制条件下，找到从结点1到结点N的最短路径。或者输出该路径不存在。若是存在多条最短路径，那么输出花钱数量最少的那条。限制：1<N<=100 ; 0<=M<=100 ; 对于每一个i，0<=S[i]<=100；正如咱们所看到的，若是没有额外的限制条件(在结点处要收费，费用不足还不给过)，那么，这个问题就和经典的迪杰斯特拉问题同样了(找到两结点间的最短路径)。在经典的迪杰斯特拉问题中，咱们使用一个一维数组来保存从开始结点到每一个结点的最短路径的长度，即M[i]表示从开始结点到结点i的最短路径的长度。然而在这个问题中，咱们还要保存咱们身上剩余多少钱这个信息。所以，很天然的，咱们将一维数组扩展为二维数组。M[i][j]表示从开始结点到结点i的最短路径长度，且剩余j元。经过这种方式，咱们将这个问题规约到原始的路径寻找问题。在每一步中，对于已经找到的最短路径，咱们找到它所能到达的下一个未标记状态(i,j)，将它标记为已访问(以后再也不访问这个结点)，而且在能到达这个结点的各个最短路径中，找到加上当前边权重值后最小值对应的路径，即为该结点的最短路径。 (写起来真是绕，建议画个图就会明了不少)。不断重复上面的步骤，直到全部的结点都访问到为止(这里的访问并非要求咱们要通过它，好比有个结点收费很高，你没有足够的钱去通过它，但你已经访问过它) 最后Min[N-1][j]中的最小值便是问题的答案(若是有多个最小值，即有多条最短路径，那么选择j最大的那条路径，即，使你剩余钱数最多的最短路径)。

伪代码：

下面有几道topcoder上的题以供练习：

Jewelry – 2003 TCO Online Round 4
StripePainter – SRM 150 Div 1
QuickSums – SRM 197 Div 2
ShortPalindromes – SRM 165 Div 2

高级

如下问题须要仔细的揣摩才能将其规约为可用DP解的问题。

问题：StarAdventure – SRM 208 Div 1:

给定一个M行N列的矩阵(M*N个格子)，每一个格子中放着必定数量的苹果。你从左上角的格子开始，只能向下或向右走，目的地是右下角的格子。你每走过一个格子，就把格子上的苹果都收集起来。而后你从右下角走回左上角的格子，每次只能向左或是向上走，一样的，走过一个格子就把里面的苹果都收集起来。最后，你再一次从左上角走到右下角，每过一个格子一样要收集起里面的苹果 (若是格子里的苹果数为0，就不用收集)。求你最多能收集到多少苹果。

注意：当你通过一个格子时，你要一次性把格子里的苹果都拿走。

限制条件：1 < N, M <= 50；每一个格子里的苹果数量是0到1000(包含0和1000)。

若是咱们只须要从左上角的格子走到右下角的格子一次，而且收集最大数量的苹果，那么问题就退化为“中级”一节里的那个问题。将这里的问题规约为“中级”里的简单题，这样一来会比较好解。让咱们来分析一下这个问题，要如何规约或是修改才能用上DP。首先，对于第二次从右下角走到左上角得出的这条路径，咱们能够将它视为从左上角走到右下角得出的路径，没有任何的差异。 (即从B走到A的最优路径和从A走到B的最优路径是同样的)经过这种方式，咱们获得了三条从顶走到底的路径。对于这一点的理解能够稍微减少问题的难度。因而，咱们能够将这3条路径记为左，中，右路径。对于两条相交路径(以下图)：

在不影响结果的状况下，咱们能够将它们视为两条不相交的路径：

这样一来，咱们将获得左，中，右3条路径。此外，若是咱们要获得最优解，路径之间不能相交(除了左上角和右下角必然会相交的格子)。所以对于每一行y( 除了第一行和最后一行)，三条路径对应的x坐标要知足：x1[y] < x2[y] < x3[y]。通过这一步的分析，问题的DP解法就进一步地清晰了。让咱们考虑行y，对于每个x1[y-1]，x2[y-1]和x3[y-1]，咱们已经找到了能收集到最多苹果数量的路径。根据它们，咱们能求出行y的最优解。如今咱们要作的就是找到从一行移动到下一行的方式。令Max[i][j][k]表示到第y-1行为止收集到苹果的最大数量，其中3条路径分别止于第i,j,k列。对于下一行y，对每一个Max[i][j][k] 都加上格子(y,i)，(y,j)和(y,k)内的苹果数量。所以，每一步咱们都向下移动。咱们作了这一步移动以后，还要考虑到，一条路径是有可能向右移动的。 (对于每个格子，咱们有多是从它上面向下移动到它，也多是从它左边向右移动到它)。为了保证3条路径互不相交，咱们首先要考虑左边的路径向右移动的状况，而后是中间，最后是右边的路径。为了更好的理解，让咱们来考虑左边的路径向右移动的状况，对于每个可能的j,k对(j<k)，对每一个i(i<j)，考虑从位置(i-1,j,k)移动到位置(i,j,k)。处理完左边的路径，再处理中间的路径，最后处理右边的路径。方法都差很少。

用于练习的topcoder题目：

MiniPaint – SRM 178 Div 1

其它

当阅读一个题目而且开始尝试解决它时，首先看一下它的限制。若是要求在多项式时间内解决，那么该问题就极可能要用DP来解。遇到这种状况，最重要的就是找到问题的“状态”和“状态转移方程”。(状态不是随便定义的，通常定义完状态，你要找到当前状态是如何从前面的状态获得的，即找到状态转移方程)若是看起来是个DP问题，但你却没法定义出状态，那么试着将问题规约到一个已知的DP问题(正如“高级”一节中的例子同样)。

后记

看完这教程离DP专家还差得远，好好coding才是王道。

来源：http://blog.csdn.net/cangchen/article/details/45045315