跳跃的舞者，舞蹈链（Dancing Links）算法——求解精确覆盖问题

时间 2019-11-14

标签跳跃舞者舞蹈 dancing links 算法求解精确覆盖问题繁體版

原文原文链接

精确覆盖问题的定义：给定一个由0-1组成的矩阵，是否能找到一个行的集合，使得集合中每一列都刚好包含一个1算法

例如：以下的矩阵数组

就包含了这样一个集合（第一、四、5行）缓存

如何利用给定的矩阵求出相应的行的集合呢？咱们采用回溯法数据结构

矩阵1：函数

先假定选择第1行，以下所示：oop

如上图中所示，红色的那行是选中的一行，这一行中有3个1，分别是第三、五、6列。编码

因为这3列已经包含了1，故，把这三列往下标示，图中的蓝色部分。蓝色部分包含3个1，分别在2行中，把这2行用紫色标示出来spa

根据定义，同一列的1只能有1个，故紫色的两行，和红色的一行的1相冲突。设计

那么在接下来的求解中，红色的部分、蓝色的部分、紫色的部分都不能用了，把这些部分都删除，获得一个新的矩阵3d

矩阵2：

行分别对应矩阵1中的第二、四、5行

列分别对应矩阵1中的第一、二、四、7列

因而问题就转换为一个规模小点的精确覆盖问题

在新的矩阵中再选择第1行，以下图所示

仍是按照以前的步骤，进行标示。红色、蓝色和紫色的部分又全都删除，致使新的空矩阵产生，而红色的一行中有0（有0就说明这一列没有1覆盖）。说明，第1行选择是错误的

那么回到以前，选择第2行，以下图所示

按照以前的步骤，进行标示。把红色、蓝色、紫色部分删除后，获得新的矩阵

矩阵3：

行对应矩阵2中的第3行，矩阵1中的第5行

列对应矩阵2中的第二、4列，矩阵1中的第二、7列

因为剩下的矩阵只有1行，且都是1，选择这一行，问题就解决

因而该问题的解就是矩阵1中第1行、矩阵2中的第2行、矩阵3中的第1行。也就是矩阵1中的第一、四、5行

在求解这个问题的过程当中，咱们第1步选择第1行是正确的，可是不是每一个题目第1步选择都是正确的，若是选择第1行没法求解出结果出来，那么就要推倒以前的选择，从选择第2行开始，以此类推

从上面的求解过程来看，实际上求解过程能够以下表示

一、从矩阵中选择一行

二、根据定义，标示矩阵中其余行的元素

三、删除相关行和列的元素，获得新矩阵

四、若是新矩阵是空矩阵，而且以前的一行都是1，那么求解结束，跳转到6；新矩阵不是空矩阵，继续求解，跳转到1；新矩阵是空矩阵，以前的一行中有0，跳转到5

五、说明以前的选择有误，回溯到以前的一个矩阵，跳转到1；若是没有矩阵能够回溯，说明该问题无解，跳转到7

六、求解结束，把结果输出

七、求解结束，输出无解消息

从如上的求解流程来看，在求解的过程当中有大量的缓存矩阵和回溯矩阵的过程。而如何缓存矩阵以及相关的数据（保证后面的回溯能正确恢复数据），也是一个比较头疼的问题（并非没法解决）。以及在输出结果的时候，如何输出正确的结果（把每一步的选择转换为初始矩阵相应的行）。

因而算法大师Donald E.Knuth（《计算机程序设计艺术》的做者）出面解决了这个方面的难题。他提出了DLX（Dancing Links X）算法。实际上，他把上面求解的过程称为X算法，而他提出的舞蹈链（Dancing Links）实际上并非一种算法，而是一种数据结构。一种很是巧妙的数据结构，他的数据结构在缓存和回溯的过程当中效率惊人，不须要额外的空间，以及近乎线性的时间。而在整个求解过程当中，指针在数据之间跳跃着，就像精巧设计的舞蹈同样，故Donald E.Knuth把它称为Dancing Links（中文译名舞蹈链）。

Dancing Links的核心是基于双向链的方便操做（移除、恢复加入）

咱们用例子来讲明

假设双向链的三个连续的元素，A一、A二、A3，每一个元素有两个份量Left和Right，分别指向左边和右边的元素。由定义可知

A1.Right=A2，A2.Right=A3

A2.Left=A1，A3.Left=A2

在这个双向链中，能够由任一个元素获得其余两个元素，A1.Right.Right=A3，A3.Left.Left=A1等等

如今把A2这个元素从双向链中移除（不是删除）出去，那么执行下面的操做就能够了

A1.Right=A3，A3.Left=A1

那么就直接链接起A1和A3。A2从双向链中移除出去了。但仅仅是从双向链中移除了，A2这个实体还在，并无删除。只是在双向链中遍历的话，遍历不到A2了。

那么A2这个实体中的两个份量Left和Right指向谁？因为实体还在，并且没有修改A2份量的操做，那么A2的两个份量指向没有发生变化，也就是在移除前的指向。即A2.Left=A1和A2.Right=A3

若是此时发现，须要把A2这个元素从新加入到双向链中的原来的位置，也就是A1和A3的中间。因为A2的两个份量没有发生变化，仍然指向A1和A3。那么只要修改A1的Right份量和A3的Left就好了。也就是下面的操做

A1.Right=A2，A3.Left=A2

仔细想一想，上面两个操做（移除和恢复加入）对应了什么？是否是对应了以前的算法过程当中的关键的两步？

移除操做对应着缓存数据、恢复加入操做对应着回溯数据。而美妙的是，这两个操做再也不占用新的空间，时间上也是极快速的

在不少实际运用中，把双向链的首尾相连，构成循环双向链

Dancing Links用的数据结构是交叉十字循环双向链

而Dancing Links中的每一个元素不只是横向循环双向链中的一份子，又是纵向循环双向链的一份子。

由于精确覆盖问题的矩阵每每是稀疏矩阵（矩阵中，0的个数多于1），Dancing Links仅仅记录矩阵中值是1的元素。

Dancing Links中的每一个元素有6个份量

分别：Left指向左边的元素、Right指向右边的元素、Up指向上边的元素、Down指向下边的元素、Col指向列标元素、Row指示当前元素所在的行

Dancing Links还要准备一些辅助元素（为何须要这些辅助元素？没有太多的道理，大师认为这能解决问题，其实是解决了问题）

Ans（）：Ans数组，在求解的过程当中保留当前的答案，以供最后输出答案用。

Head元素：求解的辅助元素，在求解的过程当中，当判断出Head.Right=Head（也能够是Head.Left=Head）时，求解结束，输出答案。Head元素只有两个份量有用。其他的份量对求解没啥用

C元素：辅助元素，称列标元素，每列有一个列标元素。本文开始的题目的列标元素分别是C一、C二、C三、C四、C五、C六、C7。每一列的元素的Col份量都指向所在列的列标元素。列标元素的Col份量指向本身（也能够是没有）。在初始化的状态下，Head.Right=C一、C1.Right=C二、……、C7.Right=Head、Head.Left=C7等等。列标元素的份量Row=0，表示是处在第0行。

下图就是根据题目构建好的交叉十字循环双向链（构建的过程后面的详述）

就上图解释一下

每一个绿色方块是一个元素，其中Head和C一、C二、……、C7是辅助元素。橙色框中的元素是原矩阵中1的元素，给他们标上号（从1到16）

左侧的红色，标示的是行号，辅助元素所在的行是0行，其他元素所在的行从1到6

每两个元素之间有一个双向箭头连线，表示双向链中相邻两个元素的关系（水平的是左右关系、垂直的是上下关系）

单向的箭头并非表示单向关系，而由于是循环双向链，左侧的单向箭头和右侧的单向箭头（上边的和下边的）组成了一个双向箭头，例如元素14左侧的单向箭头和元素16右侧的单项箭头组成一个双向箭头，表示14.Left=1六、16.Right=14；同理，元素14下边的单项箭头和元素C4上边的单向箭头组成一个双向箭头，表示14.Down=C四、C4.Up=14

接下来，利用图来解释Dancing Links是如何求解精确覆盖问题

一、首先判断Head.Right=Head？如果，求解结束，输出解；若不是，求解还没结束，到步骤2（也能够判断Head.Left=Head？）

二、获取Head.Right元素，即元素C1，并标示元素C1（标示元素C1，指的是标示C一、和C1所在列的全部元素、以及该元素所在行的元素，并从双向链中移除这些元素）。以下图中的紫色部分。

如上图可知，行2和行4中的一个必是答案的一部分（其余行中没有元素能覆盖列C1），先假设选择的是行2

三、选择行2（在答案栈中压入2），标示该行中的其余元素（元素5和元素6）所在的列首元素，即标示元素C4和标示元素C7，下图中的橙色部分。

注意的是，即便元素5在步骤2中就从双向链中移除，可是元素5的Col份量仍是指向元素C4的，这里体现了双向链的强大做用。