SICP Python 描述 3.2 函数和所生成的过程

时间 2020-02-09

标签 sicp python 描述 3.2 函数生成过程栏目 Python 繁體版

原文原文链接

3.2 函数和所生成的过程

来源：3.2 Functions and the Processes They Generatehtml

译者：飞龙git

协议：CC BY-NC-SA 4.0github

函数是计算过程的局部演化模式。它规定了过程的每一个阶段如何构建在以前的阶段之上。咱们但愿可以建立有关过程总体行为的语句，而过程的局部演化由一个或多个函数指定。这种分析一般很是困难，可是咱们至少能够试图描述一些典型的过程演化模式。算法

在这一章中，咱们会检测一些用于简单函数所生成过程的通用“模型”。咱们也会研究这些过程消耗重要的计算资源，例如时间和空间的比例。编程

3.2.1 递归函数

若是函数的函数体直接或者间接本身调用本身，那么这个函数是递归的。也就是说，递归函数的执行过程可能须要再次调用这个函数。Python 中的递归函数不须要任何特殊的语法，可是它们的确须要一些注意来正肯定义。数组

做为递归函数的介绍，咱们以将英文单词转换为它的 Pig Latin 等价形式开始。Pig Latin 是一种隐语：对英文单词使用一种简单、肯定的转换来掩盖单词的含义。Thomas Jefferson 据推测是先行者。英文单词的 Pig Latin 等价形式将辅音前缀（可能为空）从开头移动到末尾，而且添加-ay元音。因此，pun会变成unpay，stout会变成outstay，all会变成allay。缓存

>>> def pig_latin(w):
        """Return the Pig Latin equivalent of English word w."""
        if starts_with_a_vowel(w):
            return w + 'ay'
        return pig_latin(w[1:] + w[0])
>>> def starts_with_a_vowel(w):
        """Return whether w begins with a vowel."""
        return w[0].lower() in 'aeiou'

这个定义背后的想法是，一个以辅音开头的字符串的 Pig Latin 变体和另外一个字符串的 Pig Latin 变体相同：它经过将第一个字母移到末尾来建立。因而，sending的 Pig Latin 变体就和endings的变体（endingsay）相同。smother的 Pig Latin 变体和mothers的变体（othersmay）相同。并且，将辅音从开头移动到末尾会产生带有更少辅音前缀的更简单的问题。在sending的例子中，将s移动到末尾会产生以元音开头的单词，咱们的任务就完成了。数据结构

即便pig_latin函数在它的函数体中调用，pig_latin的定义是完整且正确的。函数

>>> pig_latin('pun')
'unpay'

可以基于函数自身来定义函数的想法可能十分使人混乱：“循环”定义如何有意义，这看起来不是很清楚，更不用说让计算机来执行定义好的过程。可是，咱们可以准确理解递归函数如何使用咱们的计算环境模型来成功调用。环境的图示和描述pig_latin('pun')求值的表达式树展现在下面：工具

Python 求值过程的步骤产生以下结果：

pig_latin 的def语句被执行，其中：
1. 使用函数体建立新的pig_latin函数对象，而且
2. 将名称pig_latin在当前（全局）帧中绑定到这个函数上。
starts_with_a_vowel 的def语句相似地执行。
求出pig_latin('pun')的调用表达式，经过
1. 求出运算符和操做数子表达式，经过
  1. 查找绑定到pig_latin函数的pig_latin名称
  2. 对字符串对象'pun'求出操做数字符串字面值
2. 在参数'pun'上调用pig_latin函数，经过
  1. 添加扩展自全局帧的局部帧
  2. 将形参w绑定到当前帧的实参'pun'上。
  3. 在以当前帧起始的环境中执行pig_latin的函数体
    1. 最开始的条件语句没有效果，由于头部表达式求值为False
    2. 求出最后的返回表达式pig_latin(w[1:] + w[0])，经过
      1. 查找绑定到pig_latin函数的pig_latin名称
      2. 对字符串对象'pun'求出操做数表达式
      3. 在参数'unp'上调用pig_latin，它会从pig_latin函数体中的条件语句组返回预期结果。

就像这个例子所展现的那样，虽然递归函数具备循环特征，他仍旧正确调用。pig_latin函数调用了两次，可是每次都带有不一样的参数。虽然第二个调用来自pig_latin本身的函数体，但由名称查找函数会成功，由于名称pig_latin在它的函数体执行前的环境中绑定。

这个例子也展现了 Python 的递归函数的求值过程如何与递归函数交互，来产生带有许多嵌套步骤的复杂计算过程，即便函数定义自己可能包含很是少的代码行数。

3.2.2 剖析递归函数

许多递归函数的函数体中都存在通用模式。函数体以基本条件开始，它是一个条件语句，为须要处理的最简单的输入定义函数行为。在pig_latin的例子中，基本条件对任何以元音开头的单词成立。这个时候，只须要返回末尾附加ay的参数。一些递归函数会有多重基本条件。

基本条件以后是一个或多个递归调用。递归调用有特定的特征：它们必须简化原始问题。在pig_latin的例子中，w中最开始辅音越多，就须要越多的处理工做。在递归调用pig_latin(w[1:] + w[0])中，咱们在一个具备更少初始辅音的单词上调用pig_latin -- 这就是更简化的问题。每一个成功的pig_latin调用都会更加简化，直到知足了基本条件：一个没有初始辅音的单词。

递归调用经过逐步简化问题来表达计算。与咱们在过去使用过的迭代方式相比，它们一般以不一样方式来解决问题。考虑用于计算n的阶乘的函数fact，其中fact(4)计算了4! = 4·3·2·1 = 24。

使用while语句的天然实现会经过将每一个截至n的正数相乘来求出结果。

>>> def fact_iter(n):
        total, k = 1, 1
        while k <= n:
            total, k = total * k, k + 1
        return total
>>> fact_iter(4)
24

另外一方面，阶乘的递归实现能够以fact(n-1)（一个更简单的问题）来表示fact(n)。递归的基本条件是问题的最简形式：fact(1)是1。

>>> def fact(n):
        if n == 1:
            return 1
        return n * fact(n-1)
>>> fact(4)
24

函数的正确性能够轻易经过阶乘函数的标准数学定义来验证。

(n − 1)! = (n − 1)·(n − 2)· ... · 1
n！ = n·(n − 1)·(n − 2)· ... · 1
n! = n·(n − 1)!

这两个阶乘函数在概念上不一样。迭代的函数经过将每一个式子，从基本条件1到最终的总数逐步相乘来构造结果。另外一方面，递归函数直接从最终的式子n和简化的问题fact(n-1)构造结果。

将fact函数应用于更简单的问题实例，来展开递归的同时，结果最终由基本条件构建。下面的图示展现了递归如何向fact传入1而终止，以及每一个调用的结果如何依赖于下一个调用，直到知足了基本条件。

虽然咱们可使用咱们的计算模型展开递归，一般把递归调用看作函数抽象更清晰一些。也就是说，咱们不该该关心fact(n-1)如何在fact的函数体中实现；咱们只须要相信它计算了n-1的阶乘。将递归调用看作函数抽象叫作递归的“信仰飞跃”（leap of faith）。咱们以函数自身来定义函数，可是仅仅相信更简单的状况在验证函数正确性时会正常工做。这个例子中咱们相信，fact(n-1)会正确计算(n-1)!；咱们只须要检查，若是知足假设n!是否正确计算。这样，递归函数正确性的验证就变成了一种概括证实。

函数fact_iter和fact也不同，由于前者必须引入两个额外的名称，total和k，它们在递归实现中并不须要。一般，迭代函数必须维护一些局部状态，它们会在计算过程当中改变。在任何迭代的时间点上，状态刻画了已完成的结果，以及未完成的工做总量。例如，当k为3且total为2时，就还剩下两个式子没有处理，3和4。另外一方面，fact由单一参数n来刻画。计算的状态彻底包含在表达式树的结果中，它的返回值起到total的做用，而且在不一样的帧中将n绑定到不一样的值上，而不是显式跟踪k。

递归函数能够更加依赖于解释器自己，经过将计算状态储存为表达式树和环境的一部分，而不是显式使用局部帧中的名称。出于这个缘由，递归函数一般易于定义，由于咱们不须要试着弄清必须在迭代中维护的局部状态。另外一方面，学会弄清由递归函数实现的计算过程，须要一些练习。

3.2.3 树形递归

另外一个递归的广泛模式叫作树形递归。例如，考虑斐波那契序列的计算，其中每一个数值都是前两个的和。

>>> def fib(n):
        if n == 1:
            return 0
        if n == 2:
            return 1
        return fib(n-2) + fib(n-1)
>>> fib(6)
5

这个递归定义和咱们以前的尝试有很大关系：它准确反映了斐波那契数的类似定义。考虑求出fib(6)所产生的计算模式，它展现在下面。为了计算fib(6)，咱们须要计算fib(5)和fib(4)。为了计算fib(5)，咱们须要计算fib(4)和fib(3)。一般，这个演化过程看起来像一棵树（下面的图并非完整的表达式树，而是简化的过程描述；一个完整的表达式树也拥有一样的结构）。在遍历这棵树的过程当中，每一个蓝点都表示斐波那契数的已完成计算。

调用自身屡次的函数叫作树形递归。以树形递归为原型编写的函数十分有用，可是用于计算斐波那契数则很是糟糕，由于它作了不少重复的计算。要注意整个fib(4)的计算是重复的，它几乎是一半的工做量。实际上，不可贵出函数用于计算fib(1)和fib(2)（一般是树中的叶子数量）的时间是fib(n+1)。为了弄清楚这有多糟糕，咱们能够证实fib(n)的值随着n以指数方式增加。因此，这个过程的步骤数量随输入以指数方式增加。

咱们已经见过斐波那契数的迭代实现，出于便利在这里贴出来：

>>> def fib_iter(n):
        prev, curr = 1, 0  # curr is the first Fibonacci number.
        for _ in range(n-1):
             prev, curr = curr, prev + curr
        return curr

这里咱们必须维护的状态由当前值和上一个斐波那契数组成。for语句也显式跟踪了迭代数量。这个定义并无像递归方式那样清晰反映斐波那契数的数学定义。可是，迭代实现中所需的计算总数只是线性，而不是指数于n的。甚至对于n的较小值，这个差别都很是大。

然而咱们不该该从这个差别总结出，树形递归的过程是没有用的。当咱们考虑层次数据结构，而不是数值上的操做时，咱们发现树形递归是天然而强大的工具。并且，树形过程能够变得更高效。

记忆。用于提高重复计算的递归函数效率的机制叫作记忆。记忆函数会为任何以前接受的参数储存返回值。fib(4)的第二次调用不会执行与第一次一样的复杂过程，而是直接返回第一次调用的已储存结果。

记忆函数能够天然表达为高阶函数，也能够用做装饰器。下面的定义为以前的已计算结果建立缓存，由被计算的参数索引。在这个实现中，这个字典的使用须要记忆函数的参数是不可变的。

>>> def memo(f):
        """Return a memoized version of single-argument function f."""
        cache = {}
        def memoized(n):
            if n not in cache:
                cache[n] = f(n)
            return cache[n]
        return memoized
>>> fib = memo(fib)
>>> fib(40)
63245986

由记忆函数节省的所需的计算时间总数在这个例子中是巨大的。被记忆的递归函数fib和迭代函数fib_iter都只须要线性于输入n的时间总数。为了计算fib(40)，fib的函数体只执行 40 次，而不是无记忆递归中的 102,334,155 次。

空间。为了理解函数所需的空间，咱们必须在咱们的计算模型中规定内存如何使用，保留和回收。在求解表达式过程当中，咱们必须保留全部活动环境和全部这些环境引用的值和帧。若是环境为表达式树当前分支中的一些表达式提供求值上下文，那么它就是活动环境。

例如，当求值fib时，解释器按序计算以前的每一个值，遍历树形结构。为了这样作，它只须要在计算的任什么时候间点，跟踪树中在当前节点以前的那些节点。用于求出剩余节点的内存能够被回收，由于它不会影响将来的计算。一般，树形递归所需空间与树的深度成正比。

下面的图示描述了由求解fib(3)生成的表达式树。在求解fib最初调用的返回表达式的过程当中，fib(n-2)被求值，产生值0。一旦这个值计算出来，对应的环境帧（标为灰色）就再也不须要了：它并非活动环境的一部分。因此，一个设计良好的解释器会回收用于储存这个帧的内存。另外一方面，若是解释器当前正在求解fib(n-1)，那么由此次fib调用（其中n为2）建立的环境是活动的。与之对应，最开始在3上调用fib所建立的环境也是活动的，由于这个值尚未成功计算出来。

在memo的例子中，只要一些名称绑定到了活动环境中的某个函数上，关联到所返回函数（它包含cache）的环境必须保留。cache字典中的条目数量随传递给fib的惟一参数数量线性增加，它的规模线性于输入。另外一方面，迭代实现只须要两个数值来在计算过程当中跟踪：prev和curr，因此是常数大小。

咱们使用记忆函数的例子展现了编程中的通用模式，即一般能够经过增长所用空间来减小计算时间，反之亦然。

3.2.4 示例：找零

考虑下面这个问题：若是给你半美圆、四分之一美圆、十美分、五美分和一美分，一美圆有多少种找零的方式？更一般来讲，咱们能不能编写一个函数，使用一系列货币的面额，计算有多少种方式为给定的金额总数找零？

这个问题能够用递归函数简单解决。假设咱们认为可用的硬币类型以某种顺序排列，假设从大到小排列。

使用n种硬币找零的方式为：

使用全部除了第一种以外的硬币为a找零的方式，以及
使用n种硬币为更小的金额a - d找零的方式，其中d是第一种硬币的面额。

为了弄清楚为何这是正确的，能够看出，找零方式能够分为两组，不使用第一种硬币的方式，和使用它们的方式。因此，找零方式的总数等于不使用第一种硬币为该金额找零的方式数量，加上使用第一种硬币至少一次的方式数量。然后者的数量等于在使用第一种硬币以后，为剩余的金额找零的方式数量。

所以，咱们能够递归将给定金额的找零问题，归约为使用更少种类的硬币为更小的金额找零的问题。仔细考虑这个归约原则，而且说服本身，若是咱们规定了下列基本条件，咱们就可使用它来描述算法：

若是a正好是零，那么有一种找零方式。
若是a小于零，那么有零种找零方式。
若是n小于零，那么有零种找零方式。

咱们能够轻易将这个描述翻译成递归函数：

>>> def count_change(a, kinds=(50, 25, 10, 5, 1)):
        """Return the number of ways to change amount a using coin kinds."""
        if a == 0:
            return 1
        if a < 0 or len(kinds) == 0:
            return 0
        d = kinds[0]
        return count_change(a, kinds[1:]) + count_change(a - d, kinds)
>>> count_change(100)
292

count_change函数生成树形递归过程，和fib的首个实现同样，它是重复的。它会花费很长时间来计算出292，除非咱们记忆这个函数。另外一方面，设计迭代算法来计算出结果的方式并非那么明显，咱们将它留作一个挑战。

3.2.5 增加度

前面的例子代表，不一样过程在花费的时间和空间计算资源上有显著差别。咱们用于描述这个差别的便捷方式，就是使用增加度的概念，来得到当输入变得更大时，过程所需资源的大体度量。

令n为度量问题规模的参数，R(n)为处理规模为n的问题的过程所需的资源总数。在咱们前面的例子中，咱们将n看作给定函数所要计算出的数值。可是还有其余可能。例如，若是咱们的目标是计算某个数值的平方根近似值，咱们会将n看作所需的有效位数的数量。一般，有一些问题相关的特性可用于分析给定的过程。与之类似，R(n)可用于度量所用的内存总数，所执行的基本的机器操做数量，以及其它。在一次只执行固定数量操做的计算中，用于求解表达式的所需时间，与求值过程当中执行的基本机器操做数量成正比。

咱们说，R(n)具备Θ(f(n))的增加度，写做R(n)=Θ(f(n))（读做“theta f(n)”），若是存在独立于n的常数k1和k2，那么对于任何足够大的n值：

k1·f(n) <= R(n) <= k2·f(n)

也就是说，对于较大的n，R(n)的值夹在两个具备f(n)规模的值之间：

下界k1·f(n)，以及
上界k2·f(n)。

例如，计算n!所需的步骤数量与n成正比，因此这个过程的所需步骤以Θ(n)增加。咱们也看到了，递归实现fact的所需空间以Θ(n)增加。与之相反，迭代实现fact_iter 花费类似的步骤数量，可是所需的空间保持不变。这里，咱们说这个空间以Θ(1)增加。

咱们的树形递归的斐波那契数计算函数fib 的步骤数量，随输入n指数增加。尤为是，咱们能够发现，第 n 个斐波那契数是距离φ^(n-2)/√5的最近整数，其中φ是黄金比例：

φ = (1 + √5)/2 ≈ 1.6180

咱们也表示，步骤数量随返回值增加而增加，因此树形递归过程须要Θ(φ^n)的步骤，它的一个随n指数增加的函数。

增加度只提供了过程行为的大体描述。例如，须要n^2个步骤的过程和须要1000·n^2个步骤的过程，以及须要3·n^2+10·n+17个步骤的过程都拥有Θ(n^2)的增加度。在特定的状况下，增加度的分析过于粗略，不能在函数的两个可能实现中作出判断。

可是，增加度提供了实用的方法，来表示在改变问题规模的时候，咱们应如何预期过程行为的改变。对于Θ(n)（线性）的过程，使规模加倍只会使所需的资源总数加倍。对于指数的过程，每一点问题规模的增加都会使所用资源以固定因数翻倍。接下来的例子展现了一个增加度为对数的算法，因此使问题规模加倍，只会使所需资源以固定总数增长。

3.2.6 示例：求幂

考虑对给定数值求幂的问题。咱们但愿有一个函数，它接受底数b和正整数指数n做为参数，并计算出b^n。一种方式就是经过递归定义：

b^n = b·b^(n-1)
b^0 = 1

这能够翻译成递归函数：

>>> def exp(b, n):
        if n == 0:
            return 1
        return b * exp(b, n-1)

这是个线性的递归过程，须要Θ(n)的步骤和空间。就像阶乘那样，咱们能够编写等价的线性迭代形式，它须要类似的步骤数量，但只须要固定的空间。

>>> def exp_iter(b, n):
        result = 1
        for _ in range(n):
            result = result * b
        return result

咱们能够以更少的步骤求幂，经过逐次平方。例如，咱们这样计算b^8：

b·(b·(b·(b·(b·(b·(b·b))))))

咱们可使用三次乘法来计算它：

b^2 = b·b
b^4 = b^2·b^2
b^8 = b^4·b^4

这个方法对于 2 的幂的指数工做良好。咱们也可使用这个递归规则，在求幂中利用逐步平方的优势：

咱们一样能够将这个方式表达为递归函数：

>>> def square(x):
        return x*x
>>> def fast_exp(b, n):
        if n == 0:
            return 1
        if n % 2 == 0:
            return square(fast_exp(b, n//2))
        else:
            return b * fast_exp(b, n-1)
>>> fast_exp(2, 100)
1267650600228229401496703205376

fast_exp所生成的过程的空间和步骤数量随n以对数方式增加。为了弄清楚它，能够看出，使用fast_exp计算b^2n比计算b^n只须要一步额外的乘法操做。因而，咱们可以计算的指数大小，在每次新的乘法操做时都会（近似）加倍。因此，计算n的指数所需乘法操做的数量，增加得像以2为底n的对数那样慢。这个过程拥有Θ(log n)的增加度。Θ(log n)和Θ(n)之间的差别在n很是大时变得显著。例如，n为1000时，fast_exp 仅仅须要14个乘法操做，而不是1000。