程序员编程艺术第三十四~三十五章：格子取数问题，完美洗牌算法

时间 2019-11-08

原文原文链接

第三十四~三十五章：格子取数，完美洗牌算法

做者：July、caopengcs、绿色夹克衫。致谢：西芹_new，陈利人， Peiyush Jain，白石，zinking。
时间：二零一三年八月二十三日。

题记

再过一个半月，即到2013年10月11日，即是本博客开通3周年之际，巧的是，那天恰好也是个人25岁生日。写博近3年，访问量趋近500万，没法确切知道帮助了多少人影响了多少人，但有些文章和一些系列是我比较喜欢的，如这三篇：从B树、B+树、B*树谈到R 树；教你如何迅速秒杀掉：99%的海量数据处理面试题；支持向量机通俗导论（理解SVM的三层境界）。php

以及这2个系列：数据挖掘十大算法系列，程序员编程艺术。

固然，还有不少文章或系列本身也比较喜欢（如微软面试100题系列，经典算法研究系列等等），只是上面的文章或系列更具表明性。

但若论在上述文章或系列中，哪篇文章或系列对人找工做的帮助最大，则应该是：

程序员编程艺术http://blog.csdn.net/column/details/taopp.html，
秒杀99%的海量数据处理面试题http://blog.csdn.net/v_july_v/article/details/7382693，
微软面试100题系列http://blog.csdn.net/column/details/ms100.html，

其中，尤以编程艺术系列更佳。

OK，话休絮烦，本文讲解此文 http://blog.csdn.net/v_july_v/article/details/7974418中的第75题、第79题：

第三十四章：格子取数问题；
第三十五章：完美洗牌算法的变形

如有任何问题，欢迎读者随时批评指正，感谢。

第三十四章、格子取数问题

题目详情：有n*n个格子，每一个格子里有正数或者0，从最左上角往最右下角走，只能向下和向右，一共走两次（即从左上角走到右下角走两趟），把全部通过的格子的数加起来，求最大值SUM，且两次若是通过同一个格子，则最后总和SUM中该格子的计数只加一次。

题目分析：此题是去年2013年搜狗的校招笔试题。初看到此题，由于要让两次走下来的路径总和最大，读者可能最初想到的思路多是让每一次的路径都是最优的，即不顾全局，只看局部，让第一次和第二次的路径都是最优。

但问题立刻就来了，虽然这一算法保证了连续的两次走法都是最优的，但却不能保证整体最优，相应的反例也不难给出，请看下图：

上图中，图一是原始图，那么咱们有如下两种走法可供咱们选择：

若是按照上面的局部贪优走法，那么第一次势必会如图二那样走，致使的结果是第二次要么取到2，要么取到3，
但若不按照上面的局部贪优走法，那么第一次能够如图三那样走，从而第二次走的时候能取到2 4 4，很显然，这种走法求得的最终SUM值更大；

为了便于读者理解，我把上面的走法在图二中标记出来，而把应该正确的走法在上图三中标示出来，以下图所示：

也就是说，上面图二中的走法太追求每一次最优，因此第一次最优，致使第二次将是不好；而图三第一次虽然不是最优，但保证了第二次不差，因此图三的结果优于图二。由此可知不要只顾局部而贪图一时最优，而丧失了全局最优。

解法1、直接搜索

局部贪优不行，咱们能够考虑穷举，但最终将致使复杂度太高，因此我们得另寻良策。

@西芹_new，针对此题，可使用直接搜索法，一共搜（2n-2）步，每一步有四种走法，考虑不相交等条件能够剪去不少枝，代码以下：

//copyright@西芹_new 2013
#include "stdafx.h"  
#include <iostream>  
using namespace std;  
  
#define N 5  
int map[5][5]={  
    {2,0,8,0,2},  
    {0,0,0,0,0},  
    {0,3,2,0,0},  
    {0,0,0,0,0},  
    {2,0,8,0,2}};  
int sumMax=0;  
int p1x=0;  
int p1y=0;  
int p2x=0;  
int p2y=0;  
int curMax=0;  
  
void dfs( int index){  
    if( index == 2*N-2){  
        if( curMax>sumMax)  
            sumMax = curMax;  
        return;  
    }  
  
    if( !(p1x==0 && p1y==0) && !(p2x==N-1 && p2y==N-1))  
    {  
        if( p1x>= p2x && p1y >= p2y )  
            return;  
    }  
  
    //right right  
    if( p1x+1<N && p2x+1<N ){  
        p1x++;p2x++;  
        int sum = map[p1x][p1y]+map[p2x][p2y];  
        curMax += sum;  
        dfs(index+1);  
        curMax -= sum;  
        p1x--;p2x--;  
    }  
  
    //down down  
    if( p1y+1<N && p2y+1<N ){  
        p1y++;p2y++;  
        int sum = map[p1x][p1y]+map[p2x][p2y];  
        curMax += sum;  
        dfs(index+1);  
        curMax -= sum;  
        p1y--;p2y--;  
    }  
  
    //rd  
    if( p1x+1<N && p2y+1<N ) {  
        p1x++;p2y++;  
        int sum = map[p1x][p1y]+map[p2x][p2y];  
        curMax += sum;  
        dfs(index+1);  
        curMax -= sum;  
        p1x--;p2y--;  
    }  
  
    //dr  
    if( p1y+1<N && p2x+1<N ) {  
        p1y++;p2x++;  
        int sum = map[p1x][p1y]+map[p2x][p2y];  
        curMax += sum;  
        dfs(index+1);  
        curMax -= sum;  
        p1y--;p2x--;  
    }  
}  
  
int _tmain(int argc, _TCHAR* argv[])  
{  
    curMax = map[0][0];  
    dfs(0);  
    cout <<sumMax-map[N-1][N-1]<<endl;  
    return 0;  
}

解法2、动态规划

上述解法一的搜索解法是的时间复杂度是指数型的，若是是只走一次的话，是经典的dp。html

2.一、DP思路详解

故正如@绿色夹克衫所说：此题也能够用动态规划求解，主要思路就是同时DP 2次所走的状态。ios

1、先来分析一下这个问题，为了方便讨论，先对矩阵作一个编号，且以5*5的矩阵为例（给这个矩阵起个名字叫M1）：
M1
0 1 2 3 4
1 2 3 4 5
2 3 4 5 6
3 4 5 6 7
4 5 6 7 8
从左上(0)走到右下(8)共须要走8步（2*5-2）。咱们设所走的步数为s。由于限定了只能向右和向下走，所以不管如何走，通过8步后（s = 8)都将走到右下。而DP的状态也是依据所走的步数来记录的。
再来分析一下通过其余s步后所处的位置，根据上面的讨论，能够知道：程序员

通过8步后，必定处于右下角(8)；
那么通过5步后(s = 5)，确定会处于编号为5的位置；
3步后确定处于编号为3的位置；
s = 4的时候，处于编号为4的位置，此时对于方格中，共有5（至关于n）个不一样的位置，也是全部编号中最多的。

故推广来讲，对于n*n的方格，总共须要走2n - 2步，且当s = n - 1时，编号为n个，也是编号数最多的。
若是用DP[s,i,j]来记录2次所走的状态得到的最大值，其中s表示走s步，i和j分别表示在s步后第1趟走的位置和第2趟走的位置。
2、为了方便描述，再对矩阵作一个编号（给这个矩阵起个名字叫M2）：
M2
0 0 0 0 0
1 1 1 1 1
2 2 2 2 2
3 3 3 3 3
4 4 4 4 4面试

把以前定的M1矩阵也再贴下：
M1
0 1 2 3 4
1 2 3 4 5
2 3 4 5 6
3 4 5 6 7
4 5 6 7 8
咱们先看M1，在通过6步后，确定处于M1中编号为6的位置。而M1中共有3个编号为6的，它们分别对应M2中的2 3 4。故对于M2来讲，假设第1次通过6步走到了M2中的2，第2次通过6步走到了M2中的4，DP[s,i,j] 则对应 DP[6,2,4]。因为s = 2n - 2,0 <= i<= <= j <= n，因此这个DP共有O(n^3)个状态。
M1
0 1 2 3 4
1 2 3 4 5
2 3 4 5 6
3 4 5 6 7
4 5 6 7 8
再来分析一下状态转移，以DP[6,2,3]为例(就是上面M1中加粗的部分)，能够到达DP[6,2,3]的状态包括DP[5,1,2]，DP[5,1,3]，DP[5,2,2]，DP[5,2,3]。算法

3、下面，咱们就来看看这几个状态：DP[5,1,2]，DP[5,1,3]，DP[5,2,2]，DP[5,2,3]，用加粗表示位置DP[5,1,2]    DP[5,1,3]    DP[5,2,2]    DP[5,2,3] （加红表示要达到的状态DP[6,2,3]）
0 1 2 3 4    0 1 2 3 4    0 1 2 3 4    0 1 2 3 4
1 2 3 4 5    1 2 3 4 5    1 2 3 4 5    1 2 3 4 5
2 3 4 5 6    2 3 4 5 6    2 3 4 5 6    2 3 4 5 6
3 4 5 6 7    3 4 5 6 7    3 4 5 6 7    3 4 5 6 7
4 5 6 7 8    4 5 6 7 8    4 5 6 7 8    4 5 6 7 8
  所以：编程

DP[6,2,3] = Max(DP[5,1,2] ，DP[5,1,3]，DP[5,2,2]，DP[5,2,3]) + 6,2和6,3格子中对应的数值（式一）数组

上面（式一）所示的这个递推看起来没有涉及：“若是两次通过同一个格子，那么该数只加一次的这个条件”，讨论这个条件须要换一个例子，以DP[6,2,2]为例：DP[6,2,2]能够由DP[5,1,1]，DP[5,1,2]，DP[5,2,2]到达，但因为i = j，也就是2次走到同一个格子，那么数值只能加1次。
因此当i = j时，app

DP[6,2,2] = Max(DP[5,1,1]，DP[5,1,2]，DP[5,2,2]) + 6,2格子中对应的数值（式二）
函数

四、故，综合上述的（式一），（式二）最后的递推式就是
if(i != j)
DP[s, i ,j] = Max(DP[s - 1, i - 1, j - 1], DP[s - 1, i - 1, j], DP[s - 1, i, j - 1], DP[s - 1, i, j]) + W[s,i] + W[s,j]
else
DP[s, i ,j] = Max(DP[s - 1, i - 1, j - 1], DP[s - 1, i - 1, j], DP[s - 1, i, j]) + W[s,i]

其中W[s,i]表示通过s步后，处于i位置，位置i对应的方格中的数字。下一节咱们将根据上述DP方程编码实现。

2.二、DP方法实现

为了便于实现，咱们认为全部不能达到的状态的得分都是负无穷，参考代码以下：

//copyright@caopengcs 2013
const int N = 202;
const int inf = 1000000000;  //无穷大
int dp[N * 2][N][N];  
bool isValid(int step,int x1,int x2,int n) { //判断状态是否合法
int y1 = step - x1, y2 = step - x2;
    return ((x1 >= 0) && (x1 < n) && (x2 >= 0) && (x2 < n) && (y1 >= 0) && (y1 < n) && (y2 >= 0) && (y2 < n));
}

int getValue(int step, int x1,int x2,int n) {  //处理越界 不存在的位置 给负无穷的值
    return isValid(step, x1, x2, n)?dp[step][x1][x2]:(-inf);
}

//状态表示dp[step][i][j] 而且i <= j, 第step步  两我的分别在第i行和第j行的最大得分 时间复杂度O(n^3) 空间复杂度O(n^3) 
int getAnswer(int a[N][N],int n) {
int P = n * 2 - 2; //最终的步数
int i,j,step;
    
    //不能到达的位置 设置为负无穷大
    for (i = 0; i < n; ++i) {
        for (j = i; j < n; ++j) {
            dp[0][i][j] = -inf;
        }
    
    }
    dp[0][0][0] = a[0][0];

      for (step = 1; step <= P; ++step) {
        for (i = 0; i < n; ++i) {
            for (j = i; j < n; ++j) {
                dp[step][i][j] = -inf;
                if (!isValid(step, i, j, n)) { //非法位置
                    continue;
                }
                //对于合法的位置进行dp
                if (i != j) {
                    dp[step][i][j] = max(dp[step][i][j], getValue(step - 1, i - 1, j - 1, n));
                    dp[step][i][j] = max(dp[step][i][j], getValue(step - 1, i - 1, j, n));
                    dp[step][i][j] = max(dp[step][i][j], getValue(step - 1, i, j - 1, n));
                    dp[step][i][j] = max(dp[step][i][j], getValue(step - 1, i, j,n));
                    dp[step][i][j] += a[i][step - i] + a[j][step - j];  //不在同一个格子，加两个数
                }
                else {
                    dp[step][i][j] = max(dp[step][i][j], getValue(step - 1, i - 1, j - 1, n));
                    dp[step][i][j] = max(dp[step][i][j], getValue(step - 1, i - 1, j,  n));
                    dp[step][i][j] = max(dp[step][i][j], getValue(step - 1, i, j,  n));
                    dp[step][i][j] += a[i][step - i]; // 在同一个格子里，只能加一次
                }
                
            }
        }
    }
    return dp[P][n - 1][n- 1];
}

复杂度分析：状态转移最多须要统计4个变量的状况，看作是O(1)的，共有O(n^3)个状态，因此总的时间复杂度是O(n^3)的，且dp数组开了N^3大小，故其空间复杂度亦为O(n^3)。

2.三、DP实现优化版

如上节末所说，2.2节实现的代码的复杂度空间复杂度是O(n^3)，事实上，空间上能够利用滚动数组优化，因为每一步的递推只跟上1步的状况有关，所以能够循环利用数组，将空间复杂度降为O(n^2)。
即咱们在推算dp[step]的时候，只依靠它上一次的状态dp[step - 1]，因此dp数组的第一维，咱们只开到2就能够了。即step为奇数时，咱们用dp[1][i][j]表示状态，step为偶数咱们用dp[0][i][j]表示状态，这样咱们只须要O(n^2)的空间，这就是滚动数组的方法。滚动数组写起来并不复杂，只须要对上面的代码稍做修改便可，优化后的代码以下：

//copyright@caopengcs 8/24/2013
int dp[2][N][N];

bool isValid(int step,int x1,int x2,int n) { //判断状态是否合法
int y1 = step - x1, y2 = step - x2;
    return ((x1 >= 0) && (x1 < n) && (x2 >= 0) && (x2 < n) && (y1 >= 0) && (y1 < n) && (y2 >= 0) && (y2 < n));
}

int getValue(int step, int x1,int x2,int n) {  //处理越界 不存在的位置 给负无穷的值
    return isValid(step, x1, x2, n)?dp[step % 2][x1][x2]:(-inf);
}

//状态表示dp[step][i][j] 而且i <= j, 第step步  两我的分别在第i行和第j行的最大得分 时间复杂度O(n^3) 使用滚动数组 空间复杂度O(n^2) 
int getAnswer(int a[N][N],int n) {
int P = n * 2 - 2; //最终的步数
int i,j,step,s;
    
    //不能到达的位置 设置为负无穷大
    for (i = 0; i < n; ++i) {
        for (j = i; j < n; ++j) {
            dp[0][i][j] = -inf;
        }
    
    }
    dp[0][0][0] = a[0][0];

      for (step = 1; step <= P; ++step) {
        for (i = 0; i < n; ++i) {
            for (j = i; j < n; ++j) {
                dp[step][i][j] = -inf;
                if (!isValid(step, i, j, n)) { //非法位置
                    continue;
                }
                s = step % 2;  //状态下表标
                //对于合法的位置进行dp
                if (i != j) {
                    dp[s][i][j] = max(dp[s][i][j], getValue(step - 1, i - 1, j - 1, n));
                    dp[s][i][j] = max(dp[s][i][j], getValue(step - 1, i - 1, j, n));
                    dp[s][i][j] = max(dp[s][i][j], getValue(step - 1, i, j - 1, n));
                    dp[s][i][j] = max(dp[s][i][j], getValue(step - 1, i, j,n));
                    dp[s][i][j] += a[i][step - i] + a[j][step - j];  //不在同一个格子，加两个数
                }
                else {
                    dp[s][i][j] = max(dp[s][i][j], getValue(step - 1, i - 1, j - 1, n));
                    dp[s][i][j] = max(dp[s][i][j], getValue(step - 1, i - 1, j,  n));
                    dp[s][i][j] = max(dp[s][i][j], getValue(step - 1, i, j,  n));
                    dp[s][i][j] += a[i][step - i]; // 在同一个格子里，只能加一次
                }
                
            }
        }
    }
    return dp[P % 2][n - 1][n- 1];
}

本第34章分析完毕。

第三十五章、完美洗牌算法

题目详情：有个长度为2n的数组{a1,a2,a3,...,an,b1,b2,b3,...,bn}，但愿排序后{a1,b1,a2,b2,....,an,bn}，请考虑有无时间复杂度o(n)，空间复杂度0(1)的解法。

题目来源：此题是去年2013年UC的校招笔试题，看似简单，按照题目所要排序后的字符串蛮力变化便可，但若要完美的达到题目所要求的时空复杂度，则须要咱们花费不小的精力。OK，请看下文详解，一步步优化。

解法1、蛮力变换

题目要咱们怎么变换，我们就怎么变换。此题@陈利人也分析过，在此，引用他的思路进行说明。为了便于分析，咱们取n=4，那么题目要求咱们把

a1，a2，a3，a4， b1，b2，b3，b4

变成

a1， b1，a2，b2， a3，b3， a4， b4

1.一、步步前移

仔细观察变换先后两个序列的特色，咱们可作以下一系列操做：

第①步、肯定b1的位置，即让b1跟它前面的a2，a3，a4交换：

a1， b1，a2，a3，a4， b2，b3，b4

第②步、接着肯定b2的位置，即让b2跟它前面的a3，a4交换：

a1， b1，a2， b2，a3，a4， b3，b4

第③步、b3跟它前面的a4交换位置：

a1， b1，a2， b2，a3， b3，a4， b4

b4已在最后的位置，不须要再交换。如此，通过上述3个步骤后，获得咱们最后想要的序列。但此方法的时间复杂度为O（N^2），咱们得继续寻找其它方法，看看有无办法能达到题目所预期的O（N）的时间复杂度。

1.二、中间交换

固然，除了如上面所述的让b1，b2，b3，b4步步前移跟它们各自前面的元素进行交换外，咱们还能够每次让序列中最中间的元素进行交换达到目的。仍是用上面的例子，针对a1，a2，a3，a4， b1，b2，b3，b4

第①步：交换最中间的两个元素a4，b1，序列变成（待交换的元素用粗体表示）：

a1，a2，a3，b1， a4，b2，b3，b4

第②步，让最中间的两对元素各自交换：

a1，a2， b1，a3， b2，a4， b3，b4

第③步，交换最中间的三对元素，序列变成：

a1， b1，a2， b2，a3， b3，a4， b4

一样，此法同解法1.一、步步前移同样，时间复杂度依然为O（N^2），咱们得下点力气了。

解法2、完美洗牌算法

玩过扑克牌的朋友都知道，在一局完了以后洗牌，洗牌人会习惯性的把整副牌大体分为两半，两手各拿一半对着对着交叉洗牌，以下图所示：

若是这副牌用a1 a2 a3 a4 b1 b2 b3 b4表示（为简化问题，假设这副牌只有8张牌），而后一分为二以后，左手上的牌多是a1 a2 a3 a4，右手上的牌是b1 b2 b3 b4，那么在如上图那样的洗牌以后，获得的牌就多是b1 a1 b2 a2 b3 a3 b4 a4。

技术来源于生活，2004年，microsoft的Peiyush Jain在他发表一篇名为：“A Simple In-Place Algorithm for In-Shuffle”的论文中提出了完美洗牌算法。

这个算法解决一个什么问题呢？跟本题有什么联系呢？

Yeah，顾名思义，完美洗牌算法解决的就是一个完美洗牌问题。什么是完美洗牌问题呢？即给定一个数组a1,a2,a3,...an,b1,b2,b3..bn,最终把它置换成b1,a1,b2,a2,...bn,an。读者能够看到，这个完美洗牌问题本质上与本题彻底一致，只要在完美洗牌问题的基础上对它最后的序列swap两两相邻元素便可。

即：

a1,a2,a3,...an, b1,b2,b3..bn

经过完美洗牌问题，获得：

b1,a1, b2,a2, b3,a3... bn,an

再让上面相邻的元素两两swap，便可达到本题的要求：

a1, b1,a2, b2,a3, b3....,an, bn

也就是说，若是咱们能经过完美洗牌算法（时间复杂度O(N)，空间复杂度O(1)）解决了完美洗牌问题，也就间接解决了本题。

虽然网上已有很多文章对上篇论文或翻译或作解释说明，但对于初学者来讲，理解难度实在太大，再者，若直接翻译原文，根本没法看出这个算法怎么一步步得来的，故下文将从完美洗牌算法的最基本的原型开始提及，以让读者能对此算法一目了然。

2.一、位置置换pefect_shuffle1算法

为方便讨论，咱们设定数组的下标从1开始，下标范围是[1..2n]。仍是经过以前n=4的例子，来看下每一个元素最终去了什么地方。

起始序列：a1 a2 a3 a4 b1 b2 b3 b4
数组下标：1 2 3 4 5 6 7 8
最终序列：b1 a1 b2 a2 b3 a3 b4 a4
从上面的例子咱们能看到，前n个元素中，

第1个元素a1到了原第2个元素a2的位置，即1->2；
第2个元素a2到了原第4个元素a4的位置，即2->4；
第3个元素a3到了原第6个元素b2的位置，即3->6；
第4个元素a4到了原第8个元素b4的位置，即4->8；

那么推广到通常状况便是：前n个元素中，第i个元素去了第（2 * i）的位置。

上面是针对前n个元素，那么针对后n个元素，能够看出：

第5个元素b1到了原第1个元素a1的位置，即5->1；
第6个元素b2到了原第3个元素a3的位置，即6->3；
第7个元素b3到了原第5个元素b1的位置，即7->5；
第8个元素b4到了原第7个元素b3的位置，即8->7；

推广到通常状况是，后n个元素，第i个元素去了第 (2 * (i - n) ) - 1 = 2 * i - (2 * n + 1) = (2 * i) % (2 * n + 1) 个位置。

再综合到任意状况，任意的第i个元素，咱们最终换到了 (2 * i) % (2 * n + 1)的位置。为什么呢？由于：

当0< i <n时，原式= (2i) % (2 * n + 1) = 2i；
当i>n时，原式(2 * i) % (2 * n + 1)保持不变。

所以，若是题目容许咱们再用一个数组的话，咱们直接把每一个元素放到该放得位置就行了。也就产生了最简单的方法pefect_shuffle1，参考代码以下：

// 时间O(n)，空间O(n) 数组下标从1开始
void pefect_shuffle1(int *a,int n) {
int n2 = n * 2, i, b[N];
    for (i = 1; i <= n2; ++i) {
        b[(i * 2) % (n2 + 1)] = a[i];
    }
    for (i = 1; i <= n2; ++i) {
        a[i] = b[i];
    }
}

但很明显，它的时间复杂度虽然是O(n)，但其空间复杂度倒是O(n)，仍不符合本题所期待的时间O(n)，空间O(1)。咱们继续寻找更优的解法。

与此同时，我也提醒下读者，根据上面变换的节奏，咱们能够看出有两个圈，

一个是1 -> 2 -> 4 -> 8 -> 7 -> 5 -> 1；
一个是3 -> 6 -> 3。

下文 2.3.一、走圈算法cycle_leader将再次提到这两个圈。

2.二、分而治之perfect_shuffle2算法

熟悉分治法的朋友，包括若看了此文的读者确定知道，当一个问题规模比较大时，则大而化小，分而治之。对于本题，假设n是偶数，咱们试着把数组从中间拆分红两半(为了方便描述，只看数组下标就够了)：

原始数组的下标：1....2n，即（1 .. n/2， n/2+1..n）（ n+1 .. n+n/2， n+n/2+1 .. 2n）

前半段（1 .. n/2， n/2+1..n）和后半段（n+1 .. n+n/2， n+n/2+1 .. 2n）的长度皆为n。

接下来，咱们把前半段的后n/2个元素（n/2+1 .. n）和后半段的前n/2个元素（n+1..n+n/2）交换，获得

新的前n个元素A：（1..n/2 n+1.. n+n/2）

新的后n个元素B：（ n/2+1 .. n n+n/2+1 .. 2n）

换言之，当n是偶数的时候，咱们把原问题拆分红了A，B两个子问题，继而原n的求解转换成了n‘ = n/2 的求解。

可当n是奇数的时候呢？咱们能够把前半段多出来的那个元素a先拿出来放到末尾，后面全部元素前移，于此，新数列的最后两个元素知足已知足要求，只需考虑前2*(n-1)个元素便可，继而转换成了n-1的问题。

针对上述n分别为偶数和奇数的状况，下面举n=4和n=5两个例子来讲明下。

①n=4时，原始数组即为

a1 a2 a3 a4 b1 b2 b3 b4

按照以前n为偶数时的思路，把前半段的后2个元素a3 a4同后半段的前2个元素b1 b2交换，可得：

a1 a2 b1 b2 a3 a4 b3 b4

所以，咱们只要用 pefect_shuffle1算法继续求解A（a1 a2 b1 b2）和B（a3 a4 b3 b4）两个子问题就能够了。

②当n=5时，原始数组则为

a1 a2 a3 a4 a5 b1 b2 b3 b4 b5

仍是按照以前n为奇数时的思路，先把a5先单独拎出来放在最后，而后全部剩下的元素所有前移，变为：

a1 a2 a3 a4 b1 b2 b3 b4 b5 a5

此时，最后的两个元素b5 a5已是咱们想要的结果，只要跟以前n=4的状况同样考虑便可。

参考代码以下：

//copyright@caopengcs 8/23/2013
//时间O(nlogn) 空间O(1) 数组下标从1开始  
void perfect_shuffle2(int *a,int n) {  
int t,i;  
    if (n == 1) {  
        t = a[1];  
        a[1] = a[2];  
        a[2] = t;  
        return;  
    }  
    int n2 = n * 2, n3 = n / 2;  
    if (n % 2 == 1) {  //奇数的处理  
        t = a[n];  
        for (i = n + 1; i <= n2; ++i) {  
            a[i - 1] = a[i];  
        }  
        a[n2] = t;  
        --n;  
    }  
    //到此n是偶数  
      
    for (i = n3 + 1; i <= n; ++i) {  
        t = a[i];  
        a[i] = a[i + n3];  
        a[i + n3] = t;  
    }  
      
    // [1.. n /2]  
    perfect_shuffle2(a, n3);  
    perfect_shuffle2(a + n, n3);  
}

分析下此算法的复杂度：每次，咱们交换中间的n个元素，须要O(n)的时间，n是奇数的话，咱们还须要O(n)的时间先把后两个元素调整好，但这不影响整体时间复杂度。

故事实上，当咱们采用分治算法的时候，其时间复杂度的计算公式为： T(n) = 2*T(n / 2) + O(n) ，这个就是跟归并排序同样的复杂度式子，由《算法导论》中文第二版44页的主定理，可最终解得T(n) = O(nlogn)。至于空间，此算法在数组内部折腾的，因此是O(1)（在不考虑递归的栈的空间的前提下）。

2.三、完美洗牌算法perfect_shuffle3

2.3.一、走圈算法cycle_leader

由于以前不管是perfect_shuffle1，仍是perfect_shuffle2，这两个算法的均未达到时间复杂度O（N）而且空间复杂度O（1）的要求，因此咱们必须得再找一种新的方法，以期能完美的解决本节开头提出的完美洗牌问题。

让咱们先来回顾一下2.1节位置置换perfect_shuffle1算法，还记得我以前提醒读者的关于当n=4时，经过位置置换让每个元素到了最后的位置时，所造成的两个圈么？我引用下2.1节的相关内容：

当n=4的状况：

起始序列：a1 a2 a3 a4 b1 b2 b3 b4
数组下标：1 2 3 4 5 6 7 8
最终序列：b1 a1 b2 a2 b3 a3 b4 a4

即经过置换，咱们获得以下结论：

“ 于此同时，我也提醒下读者，根据上面变换的节奏，咱们能够看出有两个圈，

一个是1 -> 2 -> 4 -> 8 -> 7 -> 5 -> 1；
一个是3 -> 6 -> 3。”

这两个圈能够表示为（1,2,4,8,7,5）和（3,6），且perfect_shuffle1算法也已经告诉了咱们，无论你n是奇数仍是偶数，每一个位置的元素都将变为第（2*i） % （2n+1）个元素：

所以咱们只要知道圈里最小位置编号的元素即圈的头部，顺着圈走一遍就能够达到目的，且由于圈与圈是不想交的，因此这样下来，咱们恰好走了O（N）步。

仍是举n=4的例子，且假定咱们已经知道第一个圈和第二个圈的前提下，要让1 2 3 4 5 6 7 8变换成5 1 2 7 3 8 4：

第一个圈：1 -> 2 -> 4 -> 8 -> 7 -> 5 -> 1

第二个圈：3 -> 6 -> 3：

原始数组： 1 2 3 4 5 6 7 8

数组小标：1 2 3 4 5 6 7 8

走第一圈： 5 1 3 2 7 6 8 4

走第二圈：5 1 6 2 7 3 8 4

上面沿着圈走的算法咱们给它取名为cycle_leader，这部分代码以下：

//数组下标从1开始，from是圈的头部，mod是要取模的数 mod 应该为 2 * n + 1，时间复杂度O(圈长）
void cycle_leader(int *a,int from, int mod) {
int last = a[from],t,i;
    
    for (i = from * 2 % mod;i != from; i = i * 2 % mod) {
        t = a[i];
        a[i] = last;
        last = t;
        
    }
    a[from] = last;
}

2.3.二、神级结论：若2*n=（3^k - 1），则可肯定圈的个数及各自头部的起始位置

下面我要引用此论文“A Simple In-Place Algorithm for In-Shuffle”的一个结论了，即

对于2*n = （3^k-1）这种长度的数组，刚好只有k个圈，且每一个圈头部的起始位置分别是1,3,9，...3^(k-1)。

论文原文部分为：

也就是说，利用上述这个结论，咱们能够解决这种特殊长度2*n = （3^k-1）的数组问题，那么若给定的长度n是任意的咋办呢？此时，咱们能够借鉴2.2节、分而治之算法的思想，把整个数组一分为二，即拆分红两个部分：

让一部分的长度知足神级结论：若2*m = （3^k-1），则刚好k个圈，且每一个圈头部的起始位置分别是1,3,9，...3^(k-1)。其中m<n，m往神级结论所需的值上套；
剩下的n-m部分单独计算；

当把n分解成m和n-m两部分后，原始数组对应的下标以下（为了方便描述，咱们依然只须要看数组下标就够了）：

原始数组下标：1..m m+1.. n， n+1 .. n+m, n+m+1,..2*n

参照以前2.2节、分而治之算法的思路，且更为了能让前部分的序列知足神级结论2*m = （3^k-1），咱们能够把中间那两段长度为n-m和m的段交换位置，即至关于把m+1..n，n+1..n+m的段循环右移m次（为何要这么作？由于如此操做后，数组的前部分的长度为2m，而根据神级结论：当2m=3^k-1时，可知这长度2m的部分刚好有k个圈）。

而若是读者看过本系列第一章、左旋转字符串的话，就应该意识到循环位移是有O（N）的算法的，其思想便是把前n-m个元素（m+1.. n）和后m个元素（n+1 .. n+m）先各自翻转一下，再将整个段（m+1.. n， n+1 .. n+m）翻转下。

这个翻转的代码以下：

//翻转字符串时间复杂度O(to - from)
void reverse(int *a,int from,int to) {
int t;
    for (; from < to; ++from, --to) {
        t = a[from];
        a[from] = a[to];
        a[to] = t;
    }
    
}

//循环右移num位 时间复杂度O(n)
void right_rotate(int *a,int num,int n) {
    reverse(a, 1, n - num);
    reverse(a, n - num + 1,n);
    reverse(a, 1, n);
}

翻转后，获得的目标数组的下标为：

目标数组下标：1..m n+1..n+m m+1 .. n n+m+1,..2*n

OK，理论讲清楚了，再举个例子便会更加一目了然。当给定n=7时，若要知足神级结论2*n=3^k-1，k只能取2，继而推得n‘=m=4。

原始数组：a1 a2 a3 a4 a5 a6 a7 b1 b2 b3 b4 b5 b6 b7

既然m=4，即让上述数组中有下划线的两个部分交换，获得：

目标数组：a1 a2 a3 a4 b1 b2 b3 b4 a5 a6 a7 b5 b6 b7

继而目标数组中的前半部分a1 a2 a3 a4 b1 b2 b3 b4部分能够用2.3.一、走圈算法cycle_leader搞定，于此咱们最终求解的n长度变成了n’=3，即n的长度减少了4，单独再解决后半部分a5 a6 a7 b5 b6 b7便可。

2.3.三、完美洗牌算法perfect_shuffle3

从上文的分析过程当中也就得出了咱们的完美洗牌算法，其算法流程为：

输入数组　A[1..2 * n]

step 1 找到 2 * m = 3^k - 1 使得 3^k <= 2 * n < 3^(k +1)
step 2 把a[m + 1..n + m]那部分循环移m位
step 3 对每一个i = 0,1,2..k - 1，3^i是个圈的头部，作cycle_leader算法，数组长度为m，因此对2 * m + 1取模。
step 4 对数组的后面部分A[2 * m + 1.. 2 * n]继续使用本算法, 这至关于n减少了m。

上述算法流程对应的论文原文为：

以上各个步骤对应的时间复杂度分析以下：

由于循环不断乘3的，因此时间复杂度O(logn)
循环移位O(n)
每一个圈，每一个元素只走了一次，一共2*m个元素，因此复杂度omega(m), 而m < n，因此也在O(n)内。
T(n - m)

所以总的时间复杂度为 T(n) = T(n - m) + O(n) ，m = omega(n) ，解得：T(n) = O(n)。

此完美洗牌算法实现的参考代码以下：

//copyright@caopengcs 8/24/2013
//时间O(n)，空间O(1)
void perfect_shuffle3(int *a,int n) {
int n2, m, i, k,t;
    for (;n > 1;) {
        // step 1
        n2 = n * 2;
        for (k = 0, m = 1; n2 / m >= 3; ++k, m *= 3)
        ;
        m /= 2;
        // 2m = 3^k - 1 , 3^k <= 2n < 3^(k + 1)
        
        // step 2
        right_rotate(a + m, m, n);
        
        // step 3
        
        for (i = 0, t = 1; i < k; ++i, t *= 3) {
            cycle_leader(a , t, m * 2 + 1);
            
        }
        
        //step 4
        a += m * 2;
        n -= m;
    
    }
    // n = 1
    t = a[1];
    a[1] = a[2];
    a[2] = t;
}

2.3.四、perfect_shuffle3算法解决其变形问题

啊哈！以上代码即解决了完美洗牌问题，那么针对本章要解决的其变形问题呢？是的，如本章开头所说，在完美洗牌问题的基础上对它最后的序列swap两两相邻元素便可，代码以下：

//copyright@caopengcs 8/24/2013
//时间复杂度O(n)，空间复杂度O(1)，数组下标从1开始，调用perfect_shuffle3
void shuffle(int *a,int n) {
    int i,t,n2 = n * 2;
    perfect_shuffle3(a,n);
    for (i = 2; i <= n2; i += 2) {
        t = a[i - 1];
        a[i - 1] = a[i];
        a[i] = t;
        
    }
}

上述的这个“在完美洗牌问题的基础上对它最后的序列swap两两相邻元素”的操做（固然，你也可让原数组第一个和最后一个不变，中间的2 * (n - 1)项用原始的标准完美洗牌算法作），只是在完美洗牌问题时间复杂度O(N)空间复杂度O(1)的基础上再增长O(N)的时间复杂度，故总的时间复杂度O(N)不变，且理所固然的保持了空间复杂度O(1)。至此，我们的问题获得了圆满解决！

2.3.五、神级结论是如何来的？

咱们的问题获得了解决，但本章还没有完，即决定完美洗牌算法的神级结论：若2*n=（3^k - 1），则刚好只有k个圈，且每一个圈头部的起始位置分别是1,3,9，...3^(k-1)，是如何来的呢？

要证实这个结论的关键就是：这全部的圈合并起来必须包含从1到M之间的全部证书，一个都不能少。这个证实有点麻烦，由于证实过程当中会涉及到群论等数论知识，但再远的路一步步走也能到达。

首先，让我们明确如下相关的概念，定理，及定义（搞清楚了这些东西，我们便证实了一大半）：

概念1 mod表示对一个数取余数，好比3 mod 5 =3，5 mod 3 =2；
定义1 欧拉函数ϕ(m) 表示为不超过m（即小于等于m）的数中，与m互素的正整数个数

定义2 若ϕ(m)=Ordm(a) 则称a为m的原根，其中Ordm(a)定义为：a ^d （ mod m），其中d=0,1,2,3…，但取让等式成立的最小的那个d。

结合上述定义一、定义2可知，2是3的原根，由于2^0 mod 3 = 1, 2^1 mod 3 = 2, 2^2 mod 3 = 1, 2^3 mod 3 = 2，{a^0 mod m，a^1 mod m，a^2}获得集合S={1,2}，包含了全部和3互质的数，也即d=ϕ(2)=2，知足原根定义。

而2不是7的原根，这是由于2^0 mod 7 = 1, 2^1 mod 7 = 2, 2^2 mod 7 = 4, 2^3 mod 7 = 1，2^4 mod 7 = 2，2^5 mod 7 = 4，2^6 mod 7 = 1，从而集合S={1,2,4}中始终只有一、二、4三种结果，而没包含所有与7互质的数（三、六、5便不包括）,，即d=3，但ϕ(7)=6，从而d != ϕ(7)，不知足原根定义。

再者，若是说一个数a，是另一个数m的原根，表明集合S = {a^0 mod m, a^1 mod m, a^2 mod m…… }，获得的集合包含了全部小于m而且与m互质的数，不然a便不是m的原根。并且集合S = {a^0 mod m, a^1 mod m, a^2 mod m…… }中可能会存在重复的余数，但当a与m互质的时候，获得的{a^0 mod m, a^1 mod m, a^2 mod m}集合中，保证了第一个数是a^0 mod m，故第一次发现重复的数时，这个重复的数必定是1，也就是说，出现余数循环必定是从开头开始循环的。

定义3 对模指数，a对模m的原根定义为 ,st:中最小的正整数d

再好比，2是9的原根，由于，为了让除以9的余数恒等于1，可知最小的正整数d=6，而ϕ(m)=6，知足原根的定义。

定理1 同余定理：两个整数a，b，若它们除以正整数m所得的余数相等，则称a，b对于模m同余，记做，读作a与b关于模m同余。

定理2 当p为奇素数且a是的原根时⇒ a也是的原根
定理3 费马小定理：若是a和m互质，那么a^ϕ(m) mod m = 1

定理4 若(a,m)=1 且a为m的原根，那么a是(Z/mZ)*的生成元。

取a = 2, m = 3。
咱们知道2是3的原根，2是9的原根，咱们定义S(k)表示上述的集合S，而且取x = 3^k（x表示为集合S中的数）。
因此：

S(1) = {1, 2}

S(2) = {1, 2, 4, 8, 7, 5}

咱们没改变圈元素的顺序，由前面的结论S(k)刚好是一个圈里的元素，且认为从1开始循环的，也就是说从1开始的圈包含了全部与3^k互质的数。

那与3^k不互质的数怎么办？若是0 < i < 3^k与 3^k不互质，那么i 与3^k的最大公约数必定是3^t的形式（只包含约数3)，而且 t < k。即gcd(i , 3^k) = 3^t，等式两边除以个3 ^ t，即得gcd( i/(3^t)，3^(k - t) ) = 1， i/(3^t) 都与3^(k - t) 互质了，而且i / (3^t) < 3^(k - t), 根据S(k)的定义，可见i/(3^t) 在集合S(k - t)中。

同理，任意S(k - t)中的数x，都知足gcd(x , 3^k) = 1,因而gcd(3^k , x* 3^t) = 3 ^ t, 而且x*3^t < 3^k。可见S(k - t)中的数x*3^t 与 i造成了一一对应的关系。
也就是说S(k - t)里每一个数x* 3^t造成的新集合包含了全部与3^k的最大公约数为3^t的数，它也是一个圈,原先圈的头部是1，这个圈的头部是3^t。
因而，对全部的小于 3^k的数，根据它和3^k的最大公约数，咱们都把它分配到了一个圈里去了，且k个圈包含了全部的小于3^k的数。

下面，举个例子，如caopengcs所说，当咱们取“a = 2, m = 3时，

咱们知道2是3的原根，2是9的原根，咱们定义S(k)表示上述的集合S，而且x= 3^k。
因此S(1) = {1, 2}
S(2) = {1, 2, 4, 8, 7, 5}

好比k = 3。咱们有：

S(3) = {1, 2 ,4 , 8, 16, 5, 10, 20, 13, 26, 25, 23, 19, 11, 22, 17, 7, 14} 包含了小于27且与27互质的全部数，圈的首部为1，这是原根定义决定的。
那么与27最大公约数为3的数，咱们用S(2)中的数乘以3获得。 S(2) * 3 = {3, 6, 12, 24, 21, 15}, 圈中元素的顺序没变化，圈的首部是3。
与27最大公约数为9的数，咱们用S(1)中的数乘以9获得。 S(1) * 9 = {9, 18}, 圈中得元素的顺序没变化，圈的首部是9。

由于每一个小于27的数和27的最大公约数只有1, 3, 9这3种状况，又因为前面所证的一一对应的关系，因此S(2) * 3包含了全部小于27且与27的最大公约数为3的数，S(1) * 9 包含了全部小于27且和27的最大公约数为9的数。 ”

换言之，若定义为整数，假设/N定义为整数Z除以N后所有余数的集合，包括{0...N-1}等N个数，而（/N)*则定义为这Z/N中{0...N-1}这N个余数内与N互质的数集合。

则当n=13时，2n+1=27，即得 /N =｛0,1,2,3,.....,26}，（/N)* 至关于就是｛0,1,2,3,.....,26}中所有与27互素的数的集合；

而2^k(mod 27)能够把（/27)*取遍，故可得这些数分别在如下3个圈内：

取头为1，（/27)*＝｛1,2,4,8,16,5,10,20,13,26,25,23,19,11,22,17,7,14｝，也就是说，与27互素且小于27的正整数集合为{1,2,4,8,16,5,10,20,13,26,25,23,19,11,22,17,7,14}，所以ϕ(m) = ϕ(27)=18, 从而知足的最小d = 18，故得出2为27的原根；
取头为3，就能够获得｛3,6,12,24,21,15｝，这就是以3为头的环，这个圈的特色是全部的数都是3的倍数，且都不是9的倍数。为何呢？由于2^k和27互素。

具体点则是：若是3×2^k除27的余数可以被9整除，则有一个n使得3*2^k=9n(mod 27)，即3*2^k－9n可以被27整除，从而3*2^k－9n＝27m，其中n，m为整数，这样一来，式子约掉一个3，咱们便能获得2^k＝9m＋3n，也就是说，2^k是3的倍数，这与2^k与27互素是矛盾的，因此，3×2^k除27的余数不可能被9整除。
此外，2^k除以27的余数能够是3的倍数之外的全部数，因此，2^k除以27的余数能够为1,2,4,5,7,8，当余数为1时，即存在一个k使得2^k-1=27m，m为整数。
式子两边同时乘以3获得：3*2^k-3=81m是27的倍数，从而3*2^k除以27的余数为3；
同理，当余数为2时，2^k - 2 = 27m，=> 3*2^k- 6 =81m，从而3*2^k除以27的余数为6；
当余数为4时，2^k - 4 = 37m，=> 3*2^k - 12 =81m，从而3*2^k除以27的余数为12；
同理，能够取到15，21，24。从而也就印证了上面的结论：取头为3，就能够获得｛3,6,12,24,21,15｝。

取9为头，这就很简单了，这个圈就是｛9,18}

你会发现，小于27的全部天然数，要么在第一个圈里面，也就是那些和27互素的数；要么在第二个圈里面，也就是那些是3的倍数，但不是9的倍数的数；要么在第三个圈里面，也就是是9倍数的数，而之因此可以这么作，就是由于2是27的本原根。证实完毕。

最后，我们也再验证下上述过程：

由于，故：

i = 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27

因为n=13，2n+1 = 27，据此公式可知，上面第 i 位置的数将分别变成下述位置的：

i = 2 4 6 8 10 12 14 16 18 20 22 24 26 1 3 5 7 9 11 13 15 17 19 21 23 25 0

根据i 和 i‘ 先后位置的变更，咱们将获得3个圈：

1248165102013262523191122177141；
36122421153
9189

没错，这3个圈的数字与我们以前获得的3个圈一致吻合，验证完毕。

2.3.六、完美洗牌问题的几个扩展

至此，本章开头提出的问题解决了，完美洗牌算法的证实也证完了，是否能够止步了呢？OH，NO！读者有无思考过下述问题：

既然完美洗牌问题是给定输入：a1,a2,a3,……aN,b1,b2,b3,……bN，要求输出：b1,a1,b2,a2,……bN,aN；那么有无考虑过它的逆问题：即给定b1,a1,b2,a2,……bN,aN,，要求输出a1,a2,a3,……aN,b1,b2,b3,……bN ？
完美洗牌问题是两手洗牌，假设有三只手同时洗牌呢？那么问题将变成：输入是a1,a2,……aN, b1,b2,……bN, c1,c2,……cN，要求输出是c1,b1,a1,c2,b2,a2,……cN,bN,aN，这个时候，怎么处理？

以上两个完美洗牌问题的几个扩展请读者思考，具体解答请参看参考连接第15条。

本第35章完。

参考连接

huangxy10，http://blog.csdn.net/huangxy10/article/details/8071242；
@绿色夹克衫，http://www.51nod.com/answer/index.html#!answerId=598；
格子取数的蛮力穷举法：http://wenku.baidu.com/view/681c853b580216fc700afd9a.html；
@陈立人，http://mp.weixin.qq.com/mp/appmsg/show?__biz=MjM5ODIzNDQ3Mw==&appmsgid=10000141&itemidx=1&sign=4f1aa1a2269a1fac88be49c8cba21042；
caopengcs，http://blog.csdn.net/caopengcs/article/details/10196035；
完美洗牌算法的原始论文“A Simple In-Place Algorithm for In-Shuffle”，http://att.newsmth.net/att.php?p.1032.47005.1743.pdf；
原始根模：http://en.wikipedia.org/wiki/Primitive_root_modulo_n；
洗牌的学问：http://www.thecodeway.com/blog/?p=680；
关于完美洗牌算法：http://cs.stackexchange.com/questions/332/in-place-algorithm-for-interleaving-an-array/400#400；
关于完美洗牌算法中圈的说明：http://www.emis.de/journals/DMTCS/pdfpapers/dm050111.pdf；
关于神级结论的讨论：http://math.stackexchange.com/questions/477125/how-to-prove-algebraic-structure-of-the-perfect-shuffle（左边连接中的讨论中有错误，以在本文2.3.5节进行了相关修正）；
caopengcs关于神级结论的证实：http://blog.csdn.net/caopengcs/article/details/10429013；
同余的概念：http://zh.wikipedia.org/wiki/%E5%90%8C%E9%A4%98；
神奇的费马小定理：http://www.xieguofang.cn/Maths/Number_Theory/Fermat's_Little_Theorem_1.htm；
完美洗牌问题的几个扩展：http://blog.csdn.net/caopengcs/article/details/10521603；
原根与指数的介绍：http://wenku.baidu.com/view/bbb88ffc910ef12d2af9e738；
《数论概论》Joseph H. Silverman著，推荐理由：因写上文中的完美洗牌算法遇到了一堆数论定理受了刺激，故推荐此书；

后记

以上第35章多是整个系列迄今为止我最满意的一篇，不只仅是由于此章思路清晰，过渡天然，代码风格良好，更由于有了@曹鹏博士的加入，编程艺术如虎添翼，质量更上一层！

:编程艺术经过解决一个个实际的编程面试题，让广大初学者一步步学会分析问题解决问题优化问题的能力，且每一个问题的讲解足够通俗，但愿后续我(们)作得愈来愈好！July、二零一三年八月二十四日凌晨零点三十七分。