第三十二~三十三章:最小操做数,木块砌墙问题
做者:July、caopengcs、红色标记。致谢:fuwutu、demo。
时间:二零一三年八月十二日
html
再过一两月,便又到了每一年的九月十月校招高峰期,在此依次推荐:java
一年半前在学校的那会,我曾经无比疯狂的创做程序员编程艺术这个系列,由于当时我坚信它能帮到更多的人找到更好的工做,此刻从此,我更加无比坚信这点。程序员
同时,相信你也已看到,编程艺术系列的创做原则是把受众定位为一个编程初学者,从看到问题后最早想到的思路开始讲解,一点一点改进,不断优化。面试
而本文主要讲下述两个问题:算法
题目详情以下:编程
给定一个单词集合Dict,其中每一个单词的长度都相同。现今后单词集合Dict中抽取两个单词A、B,咱们但愿经过若干次操做把单词A变成单词B,每次操做能够改变单词的一个字母,同时,新产生的单词必须是在给定的单词集合Dict中。求全部行得通步数最少的修改方法。数组
举个例子以下:Given:
A = "hit"
B = "cog"
Dict = ["hot","dot","dog","lot","log"]
Return
[
["hit","hot","dot","dog","cog"],
["hit","hot","lot","log","cog"]
]
"hit" -> "hot" -> "dot" -> "dog" -> "cog";"hit" -> "hot" -> "lot" -> "log" ->"cog"。缓存
详解:本题是一个典型的图搜索算法问题。此题看似跟本系列的第29章的字符串编辑距离类似,但其实区别特别大,缘由是最短编辑距离是让某个单词增长一个字符或减小一个字符或修改一个字符达到目标单词,来求变换的最少次数,但此最小操做数问题就只是改变一个字符。 函数
经过此文:http://blog.csdn.net/v_JULY_v/article/details/6111353,咱们知道,在图搜索算法中,有深度优先遍历DFS和广度优先遍历BFS,而题目中并无给定图,因此须要咱们本身创建图。性能
涉及到图就有这么几个问题要思考,节点是什么?边如何创建?图是有方向的仍是无方向的?包括建好图以后,如何记录单词序列等等都是咱们要考虑的问题。
1、建图
对于本题,咱们的图的节点就是字典里的单词,两个节点有连边,对应着咱们能够把一个单词按照规则变为另一个单词。好比咱们有单词hat,它应该与单词cat有一条连边,由于咱们能够把h变为c,反过来咱们也能够把c变为h,因此咱们创建的连边应该是无向的。
如何建图?有两种办法,
OK,上面两种方法孰优孰劣呢?直接比较n2*length 与 26 * n * length的大小。很明显,一般状况下,字典里的单词个数很是多,也就是n比较大,所以第二种方法效果会好一些,稍后的参考代码也会选择上述第二种方法的优化。
2、记录单词序列
对于最简单的bfs,咱们是如何记录路径的?若是只须要记录一条最短路径的话,咱们能够对每一个走到的位置,记录走到它的前一个位置。这样到终点后,咱们能够不断找到它的前一个位置。咱们利用了最短路径的一个特色:即第二次通过一个节点的时候,路径长度不比第一次通过它时短。所以这样的路径是没有圈的。
可是本题须要记录所有的路径,咱们第二次通过一个节点时,路径长度可能会和第一次通过一个节点时路径长度同样。这是由于,咱们可能在第i层中有多个节点能够到达第(i + 1)层的同一个位置,这样那个位置有多条路径都是最短路径。
如何解决呢?——咱们记录通过这个位置的前面全部位置的集合。这样一个节点的前驱不是一个节点,而是一个节点的集合。如此,当咱们第二次通过一个第(i+ 1)层的位置时,咱们便保留前面那第i层位置的集合做为前驱。
3、遍历
解决了以上两个问题,咱们最终获得的是什么?若是有解的话,咱们最终获得的是从终点开始的前一个可能单词的集合,对每一个单词,咱们都有能获得它的上一个单词的集合,直到起点。这就是bfs分层以后的图,咱们从终点开始遍历这个图的到起点的全部路径,就获得了全部的解,这个遍历咱们能够采用以前介绍的dfs方法(路径的数目可能很是多)。
其实,为了简单起见,咱们能够从终点开始bfs,由于记录路径记录的是以前的节点,也就是反向的。这样最终能够按顺序从起点遍历到终点的全部路径。
参考代码以下:
//copyright@caopengcs //updated@July 08/12/2013 class Solution { public: // help 函数负责找到全部的路径 void help(intx,vector<int> &d, vector<string> &word,vector<vector<int> > &next,vector<string> &path,vector<vector<string> > &answer) { path.push_back(word[x]); if (d[x] == 0) { //已经达到终点了 answer.push_back(path); } else { int i; for (i = 0; i <next[x].size(); ++i) { help(next[x][i],d, word, next,path,answer); } } path.pop_back(); //回溯 } vector<vector<string>> findLadders(string start, string end, set<string>& dict) { vector<vector<string> > answer; if (start == end) { //起点终点刚好相等 return answer; } //把起点终点加入字典的map dict.insert(start); dict.insert(end); set<string>::iterator dt; vector<string> word; map<string,int>allword; //把set转换为map,这样每一个单词都有编号了。 for (dt = dict.begin(); dt!= dict.end(); ++dt) { word.push_back(*dt); allword.insert(make_pair(*dt, allword.size())); } //创建连边 邻接表 vector<vector<int> > con; int i,j,n =word.size(),temp,len = word[0].length(); con.resize(n); for (i = 0; i < n; ++i){ for (j = 0; j <len; ++j) { char c; for (c =word[i][j] + 1; c <= 'z'; ++c) { //根据上面第二种方法的优化版的思路,让每一个单词每一个位置变动大 char last =word[i][j]; word[i][j] =c; map<string,int>::iterator t = allword.find(word[i]); if (t !=allword.end()) { con[i].push_back(t->second); con[t->second].push_back(i); } word[i][j] =last; } } } //如下是标准bfs过程 queue<int> q; vector<int> d; d.resize(n, -1); int from = allword[start],to = allword[end]; d[to] = 0; //d记录的是路径长度,-1表示没通过 q.push(to); vector<vector<int> > next; next.resize(n); while (!q.empty()) { int x = q.front(), now= d[x] + 1; //now至关于路径长度 //当now > d[from]时,则表示全部解都找到了 if ((d[from] >= 0)&& (now > d[from])) { break; } q.pop(); for (i = 0; i <con[x].size(); ++i) { int y = con[x][i]; //第一次通过y if (d[y] < 0) { d[y] = now; q.push(y); next[y].push_back(x); } //非第一次通过y else if (d[y] ==now) { //是从上一层通过的,因此要保存 next[y].push_back(x); } } } if (d[from] >= 0) { //有解 vector<string>path; help(from, d,word,next, path,answer); } return answer; } };
BFS须要把每一步搜到的节点都存下来,颇有可能每一步的搜到的节点个数愈来愈多,但最后的目的节点却只有一个。后半段的不少搜索都是白耗时间了。
上面给出了单向BFS的解法,但看过此前blog中的这篇文章“A*、Dijkstra、BFS算法性能比较演示”可知:http://blog.csdn.net/v_JULY_v/article/details/6238029,双向BFS性能优于单向BFS。
举个例子以下,第1步,是起点,1个节点,第2步,搜到2个节点,第3步,搜到4个节点,第4步搜到8个节点,第5步搜到16个节点,而且有一个是终点。那这里共出现了31个节点。从起点开始广搜的同时也从终点开始广搜,就有可能在两头各第3步,就相遇了,出现的节点数不超过(1+2+4)*2=14个,如此就节省了一半以上的搜索时间。
下面给出双向BFS的解法,参考代码以下:
//copyright@fuwutu 6/26/2013 class Solution { public: vector<vector<string>> findLadders(string start, string end, set<string>& dict) { vector<vector<string>> result, result_temp; if (dict.erase(start) == 1 && dict.erase(end) == 1) { map<string, vector<string>> kids_from_start; map<string, vector<string>> kids_from_end; set<string> reach_start; reach_start.insert(start); set<string> reach_end; reach_end.insert(end); set<string> meet; while (meet.empty() && !reach_start.empty() && !reach_end.empty()) { if (reach_start.size() < reach_end.size()) { search_next_reach(reach_start, reach_end, meet, kids_from_start, dict); } else { search_next_reach(reach_end, reach_start, meet, kids_from_end, dict); } } if (!meet.empty()) { for (set<string>::iterator it = meet.begin(); it != meet.end(); ++it) { vector<string> words(1, *it); result.push_back(words); } walk(result, kids_from_start); for (size_t i = 0; i < result.size(); ++i) { reverse(result[i].begin(), result[i].end()); } walk(result, kids_from_end); } } return result; } private: void search_next_reach(set<string>& reach, const set<string>& other_reach, set<string>& meet, map<string, vector<string>>& path, set<string>& dict) { set<string> temp; reach.swap(temp); for (set<string>::iterator it = temp.begin(); it != temp.end(); ++it) { string s = *it; for (size_t i = 0; i < s.length(); ++i) { char back = s[i]; for (s[i] = 'a'; s[i] <= 'z'; ++s[i]) { if (s[i] != back) { if (reach.count(s) == 1) { path[s].push_back(*it); } else if (dict.erase(s) == 1) { path[s].push_back(*it); reach.insert(s); } else if (other_reach.count(s) == 1) { path[s].push_back(*it); reach.insert(s); meet.insert(s); } } } s[i] = back; } } } void walk(vector<vector<string>>& all_path, map<string, vector<string>> kids) { vector<vector<string>> temp; while (!kids[all_path.back().back()].empty()) { all_path.swap(temp); all_path.clear(); for (vector<vector<string>>::iterator it = temp.begin(); it != temp.end(); ++it) { vector<string>& one_path = *it; vector<string>& p = kids[one_path.back()]; for (size_t i = 0; i < p.size(); ++i) { all_path.push_back(one_path); all_path.back().push_back(p[i]); } } } } };
题目:用 1×1×1, 1× 2×1以及2×1×1的三种木块(横绿竖蓝,且绿蓝长度均为2),
搭建高长宽分别为K × 2^N × 1的墙,不能翻转、旋转(其中,0<=N<=1024,1<=K<=4)
有多少种方案,输出结果
对1000000007取模。
详解:此题颇有意思,涉及的知识点也比较多,包括动态规划,快速矩阵幂,状态压缩,排列组合等等都一一考察了个遍。并且跟一个比较经典的矩阵乘法问题相似:即用1 x 2的多米诺骨牌填满M x N的矩形有多少种方案,M<=5,N<2^31,输出答案mod p的结果
OK,回到正题。下文使用的图示说明(全部看到的都是横切面):
首先说明“?方块”的做用
“?方块”,表示这个位置是空位置,能够任意摆放。
上图的意思就是,当右上角被绿色木块占用,此位置固定不变,其余位置任意摆放,在这种状况下的堆放方案数。
初看此题,你可能最早想到的思路即是穷举:用二维数组模拟墙,从左下角开始摆放,从左往右,从下往上,最后一个格子是右上角那个位置;每一个格子把每种能够摆放木块都摆放一次,每堆满一次算一种用摆放方法。为了便于描述,为木块的每一个格子进行编号:
下面演示当n=1,k=2的算法过程(7种状况):
穷举遍历在数据规模比较小的状况下还撑得住,但在0<=N<=1024这样的数据规模下,此方法则马上变得有心无力,所以咱们得寻找更优化的解法。
假若有墙规模为(n,k),若是从中间切开,被分为规模问(n-1,k)的两堵墙,那么被分开的墙和原墙有什么关系呢?咱们首先来看一下几组演示。
首先演示,n=1,k=2时的状况,以下图2-1:
图 2-1
上图2-1中:
表示,左边墙的全部堆放方案数 * 右边墙全部堆放方案数 = 2 * 2 = 4
表示,当切开处有一个横条的时候,空位置存在的堆放方案数。左边*右边 = 1*1 = 2;剩余两组以此类推。
这个是排列组合的知识。
其次,咱们再来演示下面更具通常性的计算分解,即当n=2,k=3的状况,以下图2-2:
图 2-2
再从分解的结果中,挑选一组进行分解演示:
图 2-3
经过图2-2和图2-3的分解演示,能够说明,最终都是分解成一列求解。在逐级向上汇总。
咱们再假设一堵墙n=4,k=3,也就是说,宽度是16,高度是3时,会有如下分解:
图2-4
根据上面的分解的一个中间结果,再进行分解,以下:
图 2-5
经过上面图2-1~图2-5的演示能够明确以下几点:
且在观察图2-5被切分后,全部左边的墙,他们的左边界ls状态始终保持不变,右边界rs状态从0~maxState, maxState = 2^k-1(有绿色方块表示1,没有表示0;ls表示左边界状态,rs表示右边状态):
图 2-6
一样能够看出右边的墙的右边界状态保持不变,而左边界状态从0~maxState。要堆砌的木墙能够看作是左边界状态=0,和右边界状态=0的一堵墙。
有一点可能要特别说明下,即上文中说,有绿色方块的状态表示标为1,无绿色方块的状态表示标为0,特地又拿上图2-6标记了一些数字,以让绝大部分读者能看得一目了然,以下所示:
这下,你应该很清楚的看到,在上图中,左边木块的状态表示一概为010,右边木块的状态表示则是000~111(即从下至上开始计数,右边木块rs的状态用二进制表示为:000 001 010 011 100 101 110 111,它们各自分别对应整数则是:0 1 2 3 4 5 6 7)。图2-7
经过图2-四、图2-五、图2-6的分解过程,咱们能够总结出下面公式(leftState=最左边边界状态,rightState=最右边边界状态):
即:
接下来,分3点解释下上述公式:
1、上述函数返回结果是当左边状态为=leftState,右边状态=rightState时木墙的堆砌方案数,至关于直接分解的左右状态都为0的状况,即直接分解f(n,k,0,0)便可 。看到这,读者可能便有疑问了,既然直接分解f(n,k,0,0)便可,为什么还要加leftstate和leftstate两个变量呢?回顾下2.1.3节中n=4,k=3的演示例子,即当n=4,k=3时,其分解过程即以下图( 上文2.1.3节中的图2-4 )也就是说,刚开始直接分解f(4,3,0,0),即n=4,k=3,leftstate=0,rightstate=0,但分解过程当中leftstate和rightstate皆从0变化到了maxstate,故才让函数的第3和第4个参数采用leftstate和rightstate这两个变量的形式,公式也就理所固然的写成了f(n,k,leftstate,rightstate)。![]()
它用方程表示即为 f(2,3,2,5),怎么得来的呢?其实仍是又回到了上文2.1.3节中,当n=2,k=3 时(下图即为上文2.1.3节中的图2-5和图2-6)
左边界ls状态始终保持不变时,右边界rs状态从0~maxState;右边界状态保持不变时,而左边界状态从0~maxState。![]()
![]()
故上述分解过程用方程式可表示为:
f(2,3,2,5) = f(1,3,2,0) * f(1,3,0,5)
+ f(1,3,2,1) * f(1,3,1,5)
+ f(1,3,2,2) * f(1,3,2,5)
+ f(1,3,2,3) * f(1,3,3,5)
+ f(1,3,2,4) * f(1,3,4,5)
+ f(1,3,2,5) * f(1,3,5,5)
+ f(1,3,2,6) * f(1,3,6,5)
+ f(1,3,2,7) * f(1,3,7,5)
下面代码就是根据上面函数原理编写的。最终执行效率,n=1024,k=4 时,用时0.2800160秒(以前代码用的是字典做为缓存,用时在1.3秒左右,后来改成数组结果,性能大增)。
//copyright@红色标记 12/8/2013 //updated@July 13/8/2013 using System; using System.Collections.Generic; using System.Text; using System.Collections; namespace HeapBlock { public class WoolWall { private int n; private int height; private int maxState; private int[, ,] resultCache; //结果缓存数组 public WoolWall(int n, int height) { this.n = n; this.height = height; maxState = (1 << height) - 1; resultCache = new int[n + 1, maxState + 1, maxState + 1]; //构建缓存数组,每一个值默认为0; } /// <summary> /// 静态入口。计算堆放方案数。 /// </summary> /// <param name="n"></param> /// <param name="k"></param> /// <returns></returns> public static int Heap(int n, int k) { return new WoolWall(n, k).Heap(); } /// <summary> /// 计算堆放方案数。 /// </summary> /// <returns></returns> public int Heap() { return (int)Heap(n, 0, 0); } private long Heap(int n, int lState, int rState) { //若是缓存数组中的值不为0,则表示该结果已经存在缓存中。 //直接返回缓存结果。 if (resultCache[n, lState, rState] != 0) { return resultCache[n, lState, rState]; } //在只有一列的状况,没法再进行切分 //根据列状态计算一列的堆放方案 if (n == 0) { return CalcOneColumnHeapCount(lState); } long result = 0; for (int state = 0; state <= maxState; state++) { if (n == 1) { //在只有两列的状况,判断当前状态在切分以后是否有效 if (!StateIsAvailable(n, lState, rState, state)) { continue; } result += Heap(n - 1, state | lState, state | lState) //合并状态。由于只有一列,因此lState和rState相同。 * Heap(n - 1, state | rState, state | rState); } else { result += Heap(n - 1, lState, state) * Heap(n - 1, state, rState); } result %= 1000000007;//为了防止结果溢出,根据题目要求求模。 } resultCache[n, lState, rState] = (int)result; //将结果写入缓存数组中 resultCache[n, rState, lState] = (int)result; //对称的墙结果相同,因此直接写入缓存。 return result; } /// <summary> /// 根据一列的状态,计算列的堆放方案数。 /// </summary> /// <param name="state">状态</param> /// <returns></returns> private int CalcOneColumnHeapCount(int state) { int sn = 0; //连续计数 int result = 1; for (int i = 0; i < height; i++) { if ((state & 1) == 0) { sn++; } else { if (sn > 0) { result *= CalcAllState(sn); } sn = 0; } state >>= 1; } if (sn > 0) { result *= CalcAllState(sn); } return result; } /// <summary> /// 相似于斐波那契序列。 /// f(1)=1 /// f(2)=2 /// f(n) = f(n-1)*f(n-2); /// 只是初始值不一样。 /// </summary> /// <param name="k"></param> /// <returns></returns> private static int CalcAllState(int k) { return k <= 2 ? k : CalcAllState(k - 1) + CalcAllState(k - 2); } /// <summary> /// 判断状态是否可用。 /// 当n=1时,分割以后,左墙和右边墙只有一列。 /// 因此state的状态码可能会覆盖原来的边缘状态。 /// 若是有覆盖,则该状态不可用;没有覆盖则可用。 /// 当n>1时,不存在这种状况,都返回状态可用。 /// </summary> /// <param name="n"></param> /// <param name="lState">左边界状态</param> /// <param name="rState">右边界状态</param> /// <param name="state">切开位置的当前状态</param> /// <returns>状态有效返回 true,状态不可用返回 false</returns> private bool StateIsAvailable(int n, int lState, int rState, int state) { return (n > 1) || ((lState | state) == lState + state && (rState | state) == rState + state); } } }
上述程序中,
由于它最终都是分解成一列的状况进行处理,这就会致使很慢。为了提升速度,本文使用了缓存机制来提升性能。缓存原理就是,n,k,leftState,rightState相同的墙,返回的结果确定相同。利用这个特性,每计算一种结果就放入到缓存中,若是下次计算直接从缓存取出。刚开始缓存用字典类实现,有网友给出了更好的缓存方法——数组。这样性能好了不少,也更加简单。程序结构以下图所示:
上图反应了Heep调用的主要方法调用,在循环中,result 累加 lResult 和 rResult。
①在实际代码中,首先是从缓存中读取结果,若是没有缓存中读取结果在进行计算。
分解法分解到一列时,不在分解,直接计算机过
if (n == 0) { return CalcOneColumnHeap(lState); }
②下面是整个程序的核心代码,经过for循环,求和state=0到state=2^k-1的两边木墙乘积 :
for (int state = 0; state <= maxState; state++) { if (n == 1) { if (!StateIsAvailable(n, lState, rState, state)) { continue; } result += Heap(n - 1, state | lState, state | lState) * Heap(n - 1, state | rState, state | rState); } else { result += Heap(n - 1, lState, state) * Heap(n - 1, state, rState); } result %= 1000000007; }
当n=1切分时,须要特殊考虑。以下图:
图2-8
看上图中,由于左边墙中间被绿色方块占用,因此在(1,0)-(1,1)这个位置(位置的标记方法同解法一)不能再放绿色方块。因此一些状态须要排除,如state=2须要排除。同时在还须要合并状态,如state=1时,左边墙的状态=3。
特别说明下:依据咱们上文2.2节中的公式,若是第i行有这种木块,state对应2^(i-1),加上全部行的贡献就获得state(0就是没有这种横跨木块,2^k-1就是全部行都是横跨木块),而后遍历state,还记得上文中的图2-7么?
当第i行被这样的木块或这样的木块
占据时,其各自对应的state值分别为:
具体来讲,下面图中全部框出来的位置,不能有绿色的:
③CalcOneColumnHeap(int state)函数用于计算一列时摆放方案数。
计算方法是, 求和被绿色木块分割开的每一段连续方格的摆放方案数。每一段连续的方格的摆放方案经过CalcAllState方法求得。通过分析,能够得知CalcAllState是相似斐波那契序列的函数。
举个例子以下(分步骤讲述):
上面程序由于调用性能的树形结构,造成了大量的函数调用和缓存查找,因此其性能不是很高。 为了获得更高的性能,可让全部的运算直接依赖于上一次运算的结果,以防止更多的调用。即若是每次运算都算出全部边界状态的结果,那么就能为下一次运算提供足够的信息。后续优化请查阅此文第3节:http://blog.csdn.net/dw14132124/article/details/9038417#t2。
相信读到上文,很多读者都已经意识到这个问题其实就是一个动态规划问题,接下来我们换一个角度来分析此问题。
首先,由于木块的宽度都是1,咱们能够想成2维的问题。也就是说三种木板的规格分别为1* 1, 1 * 2, 2 * 1。
经过上文的解法一,咱们已经知道这个问题最直接的想法就是暴力搜索,即对每一个空格尝试放置哪一种木板。可是看看数据规模就知道,这种思路是不可行的。由于有一条边范围长度高达21024,普通的电脑,230左右就到极限了。因而咱们得想一想别的方法。
为了方便,咱们把墙看作有2n行,k列的矩形。这是由于虽然矩形木块不能翻转,可是咱们同时拥有1*2和2*1的两种木块。
假设咱们从上到下,从左到右考虑每一个1*1的格子是如何被覆盖的。显然,咱们每一个格子都要被覆盖住。木块的特色决定了咱们覆盖一个格子最多只会影响到下一行的格子。这就可让咱们暂时只考虑两行。
假设现咱们已经彻底覆盖了前(i– 1)行。那么因为覆盖前(i-1)行致使第i行也不“完整”了。以下图:
xxxxxxxxx
ooxooxoxo
咱们用x表示已经覆盖的格子,o表示没覆盖的格子。为了方便,咱们使用9列。
咱们考虑第i行的状态,上图中,第1列咱们能够用1*1的覆盖掉,也能够用1*2的覆盖前两列。第四、5列的覆盖方式和第一、2列是一样的状况。第7列须要覆盖也有两种方式,即用1*1的覆盖或者用2*1的覆盖,可是这样会致使第(i+1)行第7列也被覆盖。第9列和第7列的状况是同样的。这样把第i行覆盖满了以后,咱们再根据第(i+1)行被影响的状态对下一行进行覆盖。
那么每行有多少种状态呢?显然有2k,因为k很小,咱们只有大约16种状态。若是咱们对于这些状态之间的转换制做一个矩阵,矩阵的第i行第j列的数表示的是咱们第m行是状态i,咱们把它完整覆盖掉,而且使得第(m + 1)行变成状态j的可能的方法数,这个矩阵咱们能够暴力搜索出来,搜索的方式就是枚举第m行的状态,而后尝试放木板,用全部的方法把第m行覆盖掉以后,下一行的状态。固然,咱们也能够认为只有两行,而且第一行是2k种状态的一种,第二行起初是空白的,求使得第一行彻底覆盖掉,第二行的状态有多少种类型以及每种出现多少次。
这个矩阵做用很大,其实咱们覆盖的过程能够认为是这样:第一行是空的,咱们看看把它覆盖了,第2行是什么样子的。根据第二行的状态,咱们把它覆盖掉,看看第3行是什么样子的。
若是咱们知道第i行的状态为s,怎么考虑第i行彻底覆盖后,第(i+1)行的状态?那只要看那个矩阵的状态s对应的行就能够了。咱们能够考虑一下,把两个这样的方阵相乘获得得结果是什么。这个方阵的第i行第j个元素是这样获得的,是第i行第k个元素与第k行第j个元素的对k的叠加。它的意义是上一行是第m行是状态i,把第m行和第(m+ 1)行同时覆盖住,第(m+2)行的状态是j的方法数。这是由于中间第(m+1)行的全部状态k,咱们已经彻底遍历了。
因而咱们发现,每作一次方阵的乘法,咱们至关于把状态推进了一行。那么咱们要坐多少次方阵乘法呢?就是题目中墙的长度2n,这个数太大了。可是事实上,咱们能够不断地平方n次。也就是说咱们能够算出A2,A4, A8, A16……方法就是不断用结果和本身相乘,这样乘n次就能够了。
所以,咱们最关键的问题就是创建矩阵A。咱们能够这样表示一行的状态,从左到右分别叫作第0列,第1列……覆盖了咱们认为是1,没覆盖咱们认为是0,这样一行的状态能够表示维一个整数。某一列的状态咱们能够用为运算来表示。例如,状态x第i列是否被覆盖,咱们只须要判断x & (1 << i) 是否非0便可,或者判断(x >> i) & 1, 用右移位的目的是防止溢出,可是本题不须要考虑溢出,由于k很小。 接下来的任务就是递归尝试放置方案了
最终结果,咱们最初的行是空得,要求最后一行以后也不能被覆盖,因此最终结果是矩阵的第[0][0]位置的元素。另外,本题在乘法过程当中会超出32位int的表示范围,须要临时用C/C++的long long,或者java的long。
//copyright@caopengcs 12/08/2013 #ifdef WIN32 #define ll __int64 #else #define ll long long #endif // 1 covered 0 uncovered void cal(int a[6][32][32],int n,int col,int laststate,int nowstate) { if (col >= n) { ++a[n][laststate][nowstate]; return; } //不填 或者用1*1的填 cal(a,n, col + 1, laststate, nowstate); if (((laststate >> col) & 1) == 0) { cal(a,n, col + 1, laststate, nowstate | (1 << col)); if ((col + 1 < n) && (((laststate >> (col + 1)) & 1) == 0)) { cal(a,n, col + 2, laststate, nowstate); } } } inline int mul(ll x, ll y) { return x * y % 1000000007; } void multiply(int n,int a[][32],int b[][32]) { // b = a * a int i,j, k; for (i = 0; i < n; ++i) { for (j = 0; j < n; ++j) { for (k = b[i][j] = 0; k < n; ++k) { if ((b[i][j] += mul(a[i][k],a[k][j])) >= 1000000007) { b[i][j] -= 1000000007; } } } } } int calculate(int n,int k) { int i, j; int a[6][32][32],mat[2][32][32]; memset(a,0,sizeof(a)); for (i = 1; i <= 5; ++i) { for (j = (1 << i) - 1; j >= 0; --j) { cal(a,i, 0, j, 0); } } memcpy(mat[0], a[k],sizeof(mat[0])); k = (1 << k); for (i = 0; n; --n) { multiply(k, mat[i], mat[i ^ 1]); i ^= 1; } return mat[i][0][0]; }
在本文的创做过程当中,caopengcs开始学会再也不自觉得是了,意识到文章应该尽可能写的详细点,很不错;而红色标记把最初的关于木块砌墙问题的原稿给我后,被我拉着来来回回修改了几十遍才罢休,尤为画了很多的图,辛苦感谢。
此外,围绕"编程”"面试”"算法”3大主题的程序员编程艺术系列http://blog.csdn.net/v_JULY_v/article/details/6460494,始创做于2011年4月,那会还在学校,现在已写了33章,今年内我会Review已写的这33章,且继续更新,朋友们如有发现任何问题,欢迎随时评论于原文下或向我反馈,我会迅速修正,感激涕零。
July、二零一三年八月十四日。