1
第 5章 回溯法
2
回溯法
有许多问题,当需要找出它的解集或者要求回答什么解是满足某些约束条件的最佳解时,往往要使用回溯法。
回溯法的基本做法是搜索,或是一种组织得井井有条的,能避免不必要搜索的穷举式搜索法。这种方法适用于解一些组合数相当大的问题。
回溯法在问题的解空间树中,按深度优先策略,从根结点出发搜索解空间树。算法搜索至解空间树的任意一点时,先判断该结点是否包含问题的解。如果肯定不包含,则跳过对该结点为根的子树的搜索,逐层向其祖先结点回溯;否则,进入该子树,继续按深度优先策略搜索。
3
问题的解空间
问题的解向量:回溯法希望一个问题的解能够表示成一个 n
元式 (x1,x2,…,xn)的形式。
显约束:对分量 xi的取值限定。
隐约束:为满足问题的解而对不同分量之间施加的约束。
解空间:对于问题的一个实例,解向量满足显式约束条件的所有多元组,构成了该实例的一个解空间。
注意:同一个问题可以有多种表示,有些表示方法更简单,
所需表示的状态空间更小(存储量少,搜索方法简单)。
n=3时的 0-1背包问题用完全二叉树表示的解空间
4
生成问题状态的基本方法
扩展结点,一个正在产生儿子的结点称为扩展结点
活结点,一个自身已生成但其儿子还没有全部生成的节点称做活结点
死结点,一个所有儿子已经产生的结点称做死结点
深度优先的问题状态生成法:如果对一个扩展结点 R,一旦产生了它的一个儿子 C,就把 C当做新的扩展结点。在完成对子树 C(以 C为根的子树)的穷尽搜索之后,将 R重新变成扩展结点,继续生成 R的下一个儿子(如果存在)
宽度优先的问题状态生成法:在一个扩展结点变成死结点之前,它一直是扩展结点
回溯法:为了避免生成那些不可能产生最佳解的问题状态,
要不断地利用限界函数 (bounding function)来处死那些实际上不可能产生所需解的活结点,以减少问题的计算量。 具有限界函数的深度优先生成法称为回溯法
5
回溯法的基本思想
(1)针对所给问题,定义问题的解空间;
(2)确定易于搜索的解空间结构;
(3)以深度优先方式搜索解空间,并在搜索过程中用剪枝函数避免无效搜索。
常用剪枝函数:
用约束函数在扩展结点处剪去不满足约束的子树;
用限界函数剪去得不到最优解的子树。
用回溯法解题的一个显著特征是在搜索过程中动态产生问题的解空间。在任何时刻,算法只保存从根结点到当前扩展结点的路径。如果解空间树中从根结点到叶结点的最长路径的长度为
h(n),则回溯法所需的计算空间通常为 O(h(n))。而显式地存储整个解空间则需要 O(2h(n))或 O(h(n)!)内存空间。
6
递归回溯回溯法对解空间作深度优先搜索,因此,在一般情况下用递归方法实现回溯法。
void backtrack (int t)
{
if (t>n) output(x);
else
for (int i=f(n,t);i<=g(n,t);i++) {
x[t]=h(i);
if (constraint(t)&&bound(t)) backtrack(t+1);
}
}
7
迭代回溯采用树的非递归深度优先遍历算法,可将回溯法表示为一个非递归迭代过程。
void iterativeBacktrack ()
{
int t=1;
while (t>0) {
if (f(n,t)<=g(n,t))
for (int i=f(n,t);i<=g(n,t);i++) {
x[t]=h(i);
if (constraint(t)&&bound(t)) {
if (solution(t)) output(x);
else t++;}
}
else t--;
}
}
8
子集树与排列树遍历子集树需 O(2n)计算时间 遍历排列树需要 O(n!)计算时间
void backtrack (int t)
{
if (t>n) output(x);
else
for (int i=0;i<=1;i++) {
x[t]=i;
if (legal(t)) backtrack(t+1);
}
}
void backtrack (int t)
{
if (t>n) output(x);
else
for (int i=t;i<=n;i++) {
swap(x[t],x[i]);
if (legal(t)) backtrack(t+1);
swap(x[t],x[i]);
}
}
9
装载问题有一批共 n个集装箱要装上 2艘载重量分别为 c1和 c2的轮船,其中集装箱 i的重量为 wi,且
21
1
ccwn
i
i
装载问题要求确定是否有一个合理的装载方案可将这个集装箱装上这 2艘轮船。如果有,找出一种装载方案。
容易证明,如果一个给定装载问题有解,则采用下面的策略可得到最优装载方案。
(1)首先将第一艘轮船尽可能装满;
(2)将剩余的集装箱装上第二艘轮船。
将第一艘轮船尽可能装满等价于选取全体集装箱的一个子集,
使该子集中集装箱重量之和最接近。由此可知,装载问题等价于以下特殊的 0-1背包问题。
nix
cxw
xw
i
n
i
ii
n
i
ii


1},1,0{
s,t,
m a x
1
1
1 用回溯法设计解装载问题的 O(2n)计算时间算法。在某些情况下该算法优于动态规划算法。
10
装载问题
解空间:子集树
可行性约束函数 (选择当前元素 ):
上界函数 (不选择当前元素 ):
当前载重量 cw+剩余集装箱的重量 r?当前最优载重量 bestw
1
1
cxwn
i
ii
private static void backtrack (int i)
{// 搜索第 i层结点
if (i > n) // 到达叶结点更新最优解 bestx,bestw;return;
r -= w[i];
if (cw + w[i] <= c) {// 搜索左子树
x[i] = 1;
cw += w[i];
backtrack(i + 1);
cw -= w[i]; }
if (cw + r > bestw) {
x[i] = 0; // 搜索右子树
backtrack(i + 1); }
r += w[i];
}
11
批处理作业调度给定 n个作业的集合 {J1,J2,…,J n}。每个作业必须先由机器 1处理,
然后由机器 2处理。作业 Ji需要机器 j的处理时间为 tji。对于一个确定的作业调度,设 Fji是作业 i在机器 j上完成处理的时间。所有作业在机器 2上完成处理的时间和称为该作业调度的完成时间和。
批处理作业调度问题要求对于给定的 n个作业,制定最佳作业调度方案,使其完成时间和达到最小。 jit
tji 机器 1 机器 2
作业 1 2 1
作业 2 3 1
作业 3 2 3
这 3个作业的 6种可能的调度方案是 1,2,3; 1,3,2; 2,1,3; 2,3,1;
3,1,2; 3,2,1;它们所相应的完成时间和分别是 19,18,20,
21,19,19。易见,最佳调度方案是 1,3,2,其完成时间和为
18。
12
批处理作业调度
解空间:排列树
private static void backtrack(int i)
{
if (i > n) {
for (int j = 1; j <= n; j++) bestx[j] = x[j];
bestf = f;
} else
for (int j = i; j <= n; j++) {
f1+=m[x[j]][1];
f2[i]=((f2[i-1]>f1)?f2[i-1]:f1)+m[x[j]][2];
f+=f2[i];
if (f < bestf) {
MyMath.swap(x,i,j);
backtrack(i+1);
MyMath.swap(x,i,j);
}
f1-=m[x[j]][1];
f-=f2[i];
}
}
public class FlowShop
static int n,// 作业数
f1,// 机器 1完成处理时间
f,// 完成时间和
bestf; // 当前最优值
static int [][] m; // 各作业所需的处理时间
static int [] x; // 当前作业调度
static int [] bestx; // 当前最优作业调度
static int [] f2; // 机器 2完成处理时间
13
符号三角形问题
+ + - + - + +
+ - - - - +
- + + + -
- + + -
- + -
- -
+
下图是由 14个,+”和 14个,-”组成的符号三角形。 2个同号下面都是,+”,2个异号下面都是,-”。
在一般情况下,符号三角形的第一行有 n个符号。符号三角形问题要求对于给定的 n,计算有多少个不同的符号三角形,使其所含的,+”和,-”的个数相同。
14
符号三角形问题
解 向量,用 n元组 x[1:n]表示符号三角形的第一行。
可行性约束函数:当前符号三角形所包含的,+”个数与,-”
个数均不超过 n*(n+1)/4
无解的判断,n*(n+1)/2为奇数
private static void backtrack (int t)
{
if ((count>half)||(t*(t-1)/2-count>half)) return;
if (t>n) sum++;
else for (int i=0;i<2;i++) {
p[1][t]=i;
count+=i;
for (int j=2;j<=t;j++) {
p[j][t-j+1]=p[j-1][t-j+1]^p[j-1][t-j+2];
count+=p[j][t-j+1];
}
backtrack(t+1);
for (int j=2;j<=t;j++) count-=p[j][t-j+1];
count-=i;
}
}
+ + - + - + +
+ - - - - +
- + + + -
- + + -
- + -
- -
+
复杂度分析计算可行性约束需要 O(n)时间,在最坏情况下有
O(2n)个结点需要计算可行性约束,故解符号三角形问题的回溯算法所需的计算时间为 O(n2n)。
15
n后问题在 n× n格的棋盘上放置彼此不受攻击的 n个皇后。按照国际象棋的规则,皇后可以攻击与之处在同一行或同一列或同一斜线上的棋子。 n后问题等价于在 n× n格的棋盘上放置 n个皇后,任何 2个皇后不放在同一行或同一列或同一斜线上。
1 2 3 4 5 6 7 8
1
2
3
4
5
6
7
8
Q
Q
Q
Q
Q
Q
Q
Q
16
解向量,(x1,x2,…,x n)
显约束,xi=1,2,…,n
隐约束:
1)不同列,xi?xj
2)不处于同一正、反对角线,|i-j|?|xi-xj|
n后问题
private static boolean place (int k)
{
for (int j=1;j<k;j++)
if ((Math.abs(k-j)==Math.abs(x[j]-x[k]))||(x[j]==x[k])) return false;
return true;
}
private static void backtrack (int t)
{
if (t>n) sum++;
else
for (int i=1;i<=n;i++) {
x[t]=i;
if (place(t)) backtrack(t+1);
}
17
0-1背包问题
解空间:子集树
可行性约束函数:
上界函数,11 cxw
n
i
ii
private static double bound(int i)
{// 计算上界
double cleft = c - cw; // 剩余容量
double bound = cp;
// 以物品单位重量价值递减序装入物品
while (i <= n && w[i] <= cleft)
{
cleft -= w[i];
bound += p[i];
i++;
}
// 装满背包
if (i <= n) bound += p[i] / w[i] * cleft;
return bound;
}
18
最大团问题给定无向图 G=(V,E)。如果 U?V,且对任意 u,v?U有 (u,
v)?E,则称 U是 G的 完全子图 。 G的完全子图 U是 G的团当且仅当 U不包含在 G的更大的完全子图中。 G的 最大团 是指 G中所含顶点数最多的团。
如果 U?V且对任意 u,v?U有 (u,v)?E,则称 U是 G的 空子图 。
G的空子图 U是 G的 独立集 当且仅当 U不包含在 G的更大的空子图中。 G的 最大独立集 是 G中所含顶点数最多的独立集。
对于任一无向图 G=(V,E)其 补图 G=(V1,E1)定义为,V1=V,
且 (u,v)?E1当且仅当 (u,v)?E。
U是 G的最大团当且仅当 U是 G的最大独立集。
1 2
4 5
3
1 2
4 5
3
19
最大团问题
解空间:子集树
可行性约束函数:顶点 i到已选入的顶点集中每一个顶点都有边相连。
上界函数:有足够多的可选择顶点使得算法有可能在右子树中找到更大的团。
private static void backtrack(int i)
{
if (i > n) {// 到达叶结点
for (int j = 1; j <= n; j++) bestx[j] = x[j];
bestn = cn; return; }
// 检查顶点 i 与当前团的连接
boolean ok = true;
for (int j = 1; j < i; j++)
if (x[j] == 1 && !a[i][j]) {// i与 j不相连
ok = false; break; }
if (ok) {// 进入左子树
x[i] = 1; cn++;
backtrack(i + 1);
cn--; }
if (cn + n - i > bestn) {// 进入右子树
x[i] = 0;
backtrack(i + 1); } }}
复杂度分析最大团问题的回溯算法 backtrack所需的计算时间显然为 O(n2n)。
1 2
4 5
3
20
进一步改进算法的建议
选择合适的搜索顺序,可以使得上界函数更有效的发挥作用。例如在搜索之前可以将顶点按度从小到大排序。这在某种意义上相当于给回溯法加入了启发性。
定义 Si={vi,vi+1,...,vn},依次求出 Sn,Sn-1,...,S1的解。
从而得到一个 更精确的上界函数,若 cn+Si<=max则剪枝。同时注意到:从 Si+1到 Si,如果找到一个更大的团,那么 vi必然属于找到的团,此时有 Si=Si+1+1,
否则 Si=Si+1。 因此只要 max的值被更新过,就可以确定已经找到最大值,不必再往下搜索了。
21
图的 m着色问题给定无向连通图 G和 m种不同的颜色。用这些颜色为图
G的各顶点着色,每个顶点着一种颜色。是否有一种着色法使 G中每条边的 2个顶点着不同颜色。这个问题是图的 m可着色判定问题。若一个图最少需要 m种颜色才能使图中每条边连接的 2个顶点着不同颜色,则称这个数 m为该图的色数。求一个图的色数 m的问题称为图的 m可着色优化问题。
22
解向量,(x1,x2,…,x n)表示顶点 i所着颜色 x[i]
可行性约束函数:顶点 i与已着色的相邻顶点颜色不重复。
图的 m着色问题
private static void backtrack(int t)
{
if (t>n) sum++;
else
for (int i=1;i<=m;i++) {
x[t]=i;
if (ok(t)) backtrack(t+1);
}
}
private static boolean ok(int k)
{// 检查颜色可用性
for (int j=1;j<=n;j++)
if (a[k][j] && (x[j]==x[k])) return false;
return true;
}
}
复杂度分析图 m可着色问题的解空间树中内结点个数是对于每一个内结点,在最坏情况下,用 ok检查当前扩展结点的每一个儿子所相应的颜色可用性需耗时 O(mn)。因此,回溯法总的时间耗费是

1
0
n
i
im
)()1/()1()(1
0
nnn
i
i nmOmmnmmnm
思考:图的 m着色问题与图的最大团问题有何关系,你能否利用这个关系改进最大团问题的上界?
23
旅行售货员问题?解空间:排列树
private static void backtrack(int i)
{
if (i == n) {
if (a[x[n - 1]][x[n]] < Float.MAX_VALUE && a[x[n]][1] < Float.MAX_VALUE &&
(bestc == Float.MAX_VALUE || cc+a[x[n - 1]][x[n]]+a[x[n]][1]<bestc)) {
for (int j = 1; j <= n; j++) bestx[j] = x[j];
bestc = cc+a[x[n - 1]][x[n]]+a[x[n]][1];
}
} else {
for (int j = i; j <= n; j++)
// 是否可进入 x[j]子树?
if (a[x[i - 1]][x[j]] < Float.MAX_VALUE &&
(bestc == Float.MAX_VALUE || cc+a[x[i - 1]][x[j]]<bestc)) {// 搜索子树
MyMath.swap(x,i,j);
cc+=a[x[i - 1]][x[i]];
backtrack(i + 1);
cc-=a[x[i - 1]][x[i]];
MyMath.swap(x,i,j);
}
}
复杂度分析算法 backtrack在最坏情况下可能需要更新当前最优解 O((n-1)!)次,每次更新 bestx需计算时间
O(n),从而整个算法的计算时间复杂性为 O(n!)。
24
圆排列问题给定 n个大小不等的圆 c1,c2,…,cn,现要将这 n个圆排进一个矩形框中,且要求各圆与矩形框的底边相切。圆排列问题要求从 n
个圆的所有排列中找出有最小长度的圆排列。例如,当 n=3,且所给的 3个圆的半径分别为 1,1,2时,这 3个圆的最小长度的圆排列如图所示。其最小长度为 242?
25
圆排列问题
private static float center(int t)
{// 计算当前所选择圆的圆心横坐标
float temp=0;
for (int j=1;j<t;j++) {
float valuex=x[j]+2.0*Math.sqrt(r[t]*r[j]);
if (valuex>temp) temp=valuex;
}
return temp;
}
private static void compute()
{// 计算当前圆排列的长度
float low=0,
high=0;
for (int i=1;i<=n;i++) {
if (x[i]-r[i]<low) low=x[i]-r[i];
if (x[i]+r[i]>high) high=x[i]+r[i];
}
if (high-low<min) min=high-low;
}
private static void backtrack(int t)
{
if (t>n) compute();
else
for (int j = t; j <= n; j++) {
MyMath.swap(r,t,j);
float centerx=center(t);
if (centerx+r[t]+r[1]<min) {
//下界约束
x[t]=centerx;
backtrack(t+1);
}
MyMath.swap(r,t,j);
}
}
复杂度分析由于算法 backtrack在最坏情况下可能需要计算
O(n!)次当前圆排列长度,每次计算需 O(n)计算时间,从而整个算法的计算时间复杂性为 O((n+1)!)
上述算法尚有许多改进的余地。例如,象 1,2,…,n -1,n和 n,n-
1,…,2,1 这种互为镜像的排列具有相同的圆排列长度,只计算一个就够了,可减少约一半的计算量。另一方面,如果所给的 n个圆中有 k个圆有相同的半径,则这 k个圆产生的 k!个完全相同的圆排列,只计算一个就够了。
26
连续邮资问题假设国家发行了 n种不同面值的邮票,并且规定每张信封上最多只允许贴 m张邮票。连续邮资问题要求对于给定的 n和 m的值,给出邮票面值的最佳设计,在 1张信封上可贴出从邮资 1开始,增量为 1的最大连续邮资区间。
例如,当 n=5和 m=4时,面值为 (1,3,11,15,32)的 5种邮票可以贴出邮资的最大连续邮资区间是 1到 70。
27
连续邮资问题
解向量:用 n元组 x[1:n]表示 n种不同的邮票面值,并约定它们从小到大排列。 x[1]=1是惟一的选择。
可行性约束函数:已选定 x[1:i-1],最大连续邮资区间是 [1:r],
接下来 x[i]的可取值范围是 [x[i-1]+1:r+1]。
如何确定 r的值?
计算 X[1:i]的最大连续邮资区间在本算法中被频繁使用到,因此势必要找到一个高效的方法。考虑到直接递归的求解复杂度太高,我们不妨尝试计算用不超过 m张面值为 x[1:i]的邮票贴出邮资 k所需的最少邮票数 y[k]。通过 y[k]可以很快推出 r的值。事实上,y[k]可以通过递推在 O(n)时间内解决:
for (int j=0; j<= x[i-2]*(m-1);j++)
if (y[j]<m)
for (int k=1;k<=m-y[j];k++)
if (y[j]+k<y[j+x[i-1]*k]) y[j+x[i-1]*k]=y[j]+k;
while (y[r]<maxint) r++;
28
回溯法效率分析通过前面具体实例的讨论容易看出,回溯算法的效率在很大程度上依赖于以下因素:
(1)产生 x[k]的时间;
(2)满足显约束的 x[k]值的个数;
(3)计算约束函数 constraint的时间;
(4)计算上界函数 bound的时间;
(5)满足约束函数和上界函数约束的所有 x[k]的个数。
好的约束函数能显著地减少所生成的结点数。但这样的约束函数往往计算量较大。因此,在选择约束函数时通常存在生成结点数与约束函数计算量之间的折衷。
29
重排原理对于许多问题而言,在搜索试探时选取 x[i]的值顺序是任意的。
在其他条件相当的前提下,让可取值最少的 x[i]优先 。从图中关于同一问题的 2棵不同解空间树,可以体会到这种策略的潜力。
图 (a)中,从第 1层剪去 1棵子树,则从所有应当考虑的 3元组中一次消去 12个 3元组。对于图 (b),虽然同样从第 1层剪去 1棵子树,却只从应当考虑的 3元组中消去 8个 3元组。前者的效果明显比后者好。
(a)
(b)