scheme 之门

时间 2020-05-29

标签 scheme 之门繁體版

原文原文链接

scheme 之门

开始以前

这是一篇 Scheme 的介绍文章. Scheme 是一个 LISP 的方言, 相对于 Common LISP 或其余方言, 它更强调理论的完整和优美, 而不那么强调实用价值. 我在学习 Scheme 的时候, 常想的不是 "这有什么用", 而是 "为何" 和 "它的本质是什么". 我以为这样的思考对学习计算机是很是有益的.算法

我不知道 "Scheme 之道" 这个题目是否合适, 我还没到能讲 "XXX 之道" 的时候. 但 Scheme 确实是一个极具哲学趣味的语言, 它每每专一于找出事物的本质, 用最简单, 最通用的方法解决问题. 这样的思路下, 咱们会碰到许多以往不会遇到, 或不甚留意的问题, 使咱们对这些问题, 以及计算机科学的其余方面有新的认识和思考.编程

讲 Scheme 的好书有不少, 但 Scheme 在这些书中每每就像指着月亮的慧能的手指或是道家的拂尘, 指引你发现计算机科学中的某些奇妙之处, 但 Scheme 自己却不是重点. 如SICP (Structure and Interpretation of Computer Programs) 用 Scheme 来指引学生学习计算机科学中的基本概念; HTDP (How to design programs) 用Scheme 来介绍程序设计中经常使用的技巧和方法. 而这篇文章, 着眼点也不是scheme 自己, 或者着眼点不在 scheme 的 "形", 而在与 scheme 的 "神". 怎么写一个好的 scheme 程序不是个人重点, 个人重点是 "这个设计真美妙", "原来本质就是如此", 如是而已. Scheme 的一些理论和设计启发了我 , 使我在一些问题, 一些项目上有了更好的想法. 感念至今, 因此写一系列小文将个人体会与你们分享.数组

要体验 Scheme, 固然首先要一个 Scheme 的编程环境. 我推荐 drScheme (http://www.drscheme.org), 跨平台, 包括了一个很好的编辑和调试界面 . Debian/Ubuntu 用户直接 apt-get 安装便可.数据结构

但愿读者有基本的编程和数据结构知识. 由于解释 Scheme 的不少概念时, 这些知识是必须的.app

数据结构的本质论

世界的终极问题

这两个多是人类对世界认识的终极问题: 世界上最基本的, 不可再分的物质单位是什么? 这些最基本的物质单位是怎么组成这个大千世界的?框架

Scheme 也在试图解答这个问题.函数

Scheme 认为如下两种东西是原子性的, 不可再分的: 数, 符号. 数这个好理解, 符号这个概念就有点麻烦了. 作个比方, "1" 是一个数字, 但它实际上是一个符号, 咱们用这个符号去表明 "1" 这个概念, 咱们也能够用 "一" 或 "one" 表明这个概念, 固然 "1" 也能够表示 "真" 的概念, 或者什么都不表示. 而 kyhpudding 也是一个 Scheme 中的符号, 它能够表明任何东西, Scheme 能理解的或不能理解的. 这都没所谓, Scheme 把它做为一个原子单位对它进行处理: 1 能跟其余数字做运算得出一个新的数字, 但 1 始终仍是 1, 它不会被分解或变成其余什么东西, 做为符号的 kyhpudding 也大抵如此.工具

下一个问题是: 怎么将原子组成各类复合的数据结构 --- 有没有一种统一的方法?学习

咱们从最简单的问题开始: 怎么将两个对象聚合在一块儿? 因而咱们引入了 "对 " (pair) 的概念, 用以聚合两个对象: a 和 b 组成的对, 记为:测试

(a . b)

画图

(a . b) - b

请你们将头往左侧 45 度, 这其实就是一个二叉树.

若是是要聚合三个或以上的数据呢? pair 的方法还适用吗? 咱们是否须要引入其余方法? 答案是不须要, 咱们递归地使用 pair 结构就能够了. 聚合 a, b, c, 记为 (a . (b . c)), 它的简化记法是 (a b . c).

你们都能想到了, 递归地使用 pair 二叉树的结构, 就能表达任意多个对象组成的序列. 好比 (a b . c), 画图就是:

(a b . c) - (b . c) - c

| |

a b

请你们继续将头左侧 45 度. 这样的一个表示序列的树的特色是, 树的左结点是成员对象, 右结点指向一颗包含其余成员的子树. 但你们也发现了一个破例: 图中的 c 是右边的叶子. 解决这个问题的办法是: 咱们引入一个 "无" 的概念:

(a b c . nil) - (b c . nil) - (c . nil) - nil

| | |

a b c

这个无的概念咱们用 "()" 来表达 (总不能什么都没有吧). 记 (a . ()) 为 (a). 那么上图就能够表示为 (a b c). 这样的结构咱们就叫作列表 --- List. 这是 Scheme/LISP 中应用最广的概念. LISP 其实就是 "LISt Processing" 的意思.

这样的结构表达能力很强, 由于它是可递归的, 它能够表达任何东西. 比方说, 一个普通的二叉树能够像这样表示 (根 (根左子树右子树) 右子树). 你们也能够想一想其余的数据结构怎么用这种递归的列表来表示.

开始编程啦

好了, 咱们能够开始写一点很简单的 Scheme 程序. 比方说, 打入 1, 它就会返回 1. 而后, 打入一个列表 (1 2), 出错鸟... 打入一个符号: kyhpudding, 也出错鸟......

因而咱们就要开始讲一点点 Scheme 的运做原理了. 刚才咱们讲了 Scheme 中的数据结构, 其实不可是 Scheme 处理的数据, 整个 Scheme 程序都是由这样的列表和原子对象构成的, 一个合法的 Scheme 数据结构就是一个 Scheme 语句. 那么这样的语句是怎么运行的呢? 总结起来就是三条逻辑:

若是那是一个数, 则返回这个数
若是那是一个符号, 则返回该符号所绑定的对象. (这个概念咱们会迟点解释)
若是那是一个列表, 把列表的第一项做为方法, 其余做为参数, 执行之.

因此, 咱们能够试试这个 (+ 1 2), 这下就能正确执行了.

那么, 若是我就想要他返回 (+ 1 2) 这个列表呢? 试试这样 (quote (+ 1 2)) quote 是一个很特殊的操做, 意思是它的参数不按规则处理, 而是直接做为数据返回. 咱们会经常用到它, 因此也有一个简化的写法 '(+ 1 2), 在前面加一个单引号就能够了. 这样子, 'kyhpudding 也能有正确的输出了.

那么咱们能够介绍三个原子操做, 用以操纵列表. 其实, 所谓操纵列表, 也只是操纵二叉树而已. 因此咱们有这么三个操做:

cons: 将它的两个参数组合起来, 造成新的二叉树/pair
car: 返回参数的左子树
cdr: 返回参数的右子树

经过如下几个操做, 结合对应的二叉树图, 能比较好的理解这个 Scheme 最基础的设计:

(cons 'a (cons 'b '()))

(car '(a b c))

(cdr '(a b c))

无处不在的函数

基本的函数概念

Scheme 是一门函数式语言, 由于它的函数与数据有彻底平等的地位, 它能够在运行时被实时建立和修改. 也由于它的所有运行均可以用函数的方式来解释, 莫能例外.

比方说, 把 if 语句做为函数来解释? (if cond if-part else-part) 是这么一个特殊的函数: 它根据 cond 是否为真, 决定执行并返回 if-part 仍是 else-part. 好比, 我能够这样写:

((if (i-am-feeling-lucky) + -) my-happyness 1)

if 函数会根据我开心与否 (i-am-feeling-lucky 是一个由我决定它的返回值的函数 :P) 返回 + 或 - 来做为对个人开心值的操做. 所谓无处不在的函数, 其意义大抵如此.

把一串操做序列当成函数呢? Scheme 是没有 "return" 的, 把一串操做序列看成一个总体, 它的返回值就是这一串序列的最后一个的返回值. 好比咱们能够写

(begin (+ 1 2) (+ 3 4))

它的返回是 7.

无名的能量之源

接下来, 咱们就要接触到 Scheme 的灵魂 --- Lambda. 你们能够注意到 drScheme 的图标, 那就是希腊字母 Lambda. 能够说明 Lambda 运算在 Scheme 中是多么重要.

NOTE: 这里原本应该插一点 Lambda 运算的知识的, 可是一来我本身数学就不怎么好没什么信心能讲好, 二来说太深了也没有必要. 你们若是对 Lambda 运算的理论有兴趣的话, 能够自行 Google 相关资料.

Lambda 可以返回一个匿名的函数. 在这里须要注意两点: 第一, 我用的是 "返回" 而不是 "定义". 由于 Lambda 一样能够当作一个函数 --- 一个可以生成函数的函数. 第二, 它是匿名的, 意思是, 一个函数并不必定须要与一个名字绑定在一块儿, 咱们有时侯须要这么干, 但也有不少时候不须要.

咱们能够看一个 Lambda 函数的基本例子:

((lambda (x y) (+ x y)) 1 2)

这里描述了一个加法函数的生成和使用. (lambda (x y) (+ x y)) 中, lambda 的第一个参数说明了参数列表, 以后的描述了函数的行为. 这就生成了一个函数 , 咱们再将 1 和 2 做用在这个函数上, 天然能获得结果 3.

咱们先引入一个 define 的操做, define 的做用是将一个符号与一个对象绑定起来. 好比

(define name 'kyhpudding)

以后再敲入 name, 这时候 Scheme 解释器就知道如何处理它了, 它会返回一个

kyhpudding.

咱们天然也能够用 define 把一个符号和函数绑定在一块儿, 就获得了咱们经常使用的有名函数.

(define add

(lambda (x y) (+ x y)))

作一个简单的替换, 上面的例子就能够写成 (add 1 2), 这样就好理解多了.

上面的写法有点晦涩, 而咱们常常用到的是有名函数, 因此咱们有一个简单的写法, 咱们把这一类简化的写法叫 "语法糖衣". 在前面咱们也遇到一例, 将 (quote x) 写成 'x 的例子. 上面的定义, 咱们能够这样写

(define (add x y) (+ x y))

Lambda 运算有极其强大的能力, 上面只不过是用它来作传统的 "定义函数" 的工做. 它的能力远不止如此. 这里只是举几个小小的例子:

咱们常常会须要一些用于迭代的函数, 好比这个:

(define (inc x) (+ x 1))

咱们也须要减的, 乘的, 还有其余各类乱七八糟的操做, 咱们须要每次迭代不是 1, 而是 2, 等等等等. 咱们很天然地有这个想法: 咱们写个函数来生成这类迭代函数如何? 在 Scheme 中, 利用 lambda 运算, 这是可行且很是简单的. 由于在 Scheme 中, 函数跟普通对象是有一样地位的, 而 "定义" 函数的 lambda, 实际上是可以动态地为咱们创造并返回函数对象的. 因此咱们能够这么写:

(define (make-iterator method step)

(lambda (x) (method x step)))

没有语法糖衣的写法是:

(define make-iterator

(lambda (method step)

(lambda (x) (method x step))))

这个简单的例子, 已经可以完成咱们在 C 之类的语言没法完成的事情. 要生成上面的 inc 函数, 咱们能够这么写:

(define inc (make-iterator + 1))

这个例子展现的是 Scheme 利用 Lambda 运算获得的能力. 利用它, 咱们能够写出制造函数的函数, 或者说制造机器的机器, 这极大地扩展了这门语言的能力 . 咱们在之后会有更复杂的例子.

接下来, 咱们会介绍 Scheme 的一些语言特性是怎么用 Lambda 运算实现的 --- 说 Scheme 的整个机制是由 Lambda 驱动的也不为过.

好比, 在 Scheme 中咱们能够在任何地方定义 "局部变量", 咱们能够这么写:

(let ((x 1) (y 2)) 运用这些局部变量的语句)

其实 let 也只不过是语法糖衣而已, 由于上面的写法等价于:

((lambda (x y)

运用这些局部变量的语句)

1 2)

一些经常使用的函数

虽说这篇文章不太注重语言的实用性. 但这里仍是列出咱们常常用到的一些操做, 这能极大地方便咱们的编程, 你们也能够想一想他们是怎么实现的.

cond

至关于 C 中的 switch

(cond

(条件1 执行体)

(条件2 执行体)

(else 执行体))

循环语句

没有循环语句...... 至少没有必要的循环语句. Scheme 认为, 任何的循环迭代均可以用递归来实现. 咱们也不用担忧递归会把栈占满, 由于 Scheme 会自动处理尾递归的状况. 一个简单的 0 到 10 迭代能够写成这样.

(define (iterate x)

(if (= x 10)

(iterate (+ x 1))))

(iterate 0)

很明显, 当咱们递归调用 iterate 的时候, 咱们没必要保存当前的函数环境. 因为咱们递归调用完毕后就立刻返回, 而不会再使用当前的环境, 这是一给尾递归的例子. Scheme 能自动处理相似的状况甚至作一些优化, 不会浪费多余的空间, 也不会下降效率. 因此彻底能够代替循环.

固然咱们有些便于循环迭代的操做, 你们能够试试本身实现他们. (固然在解释器内部一般不会用纯 scheme 语句实现他们). 咱们最经常使用的是 map 操做

(map (lambda (x) (+ x 1)) '(1 2 3))

运行一下这个例子, 就能理解 map 的做用了.

无始无终的太极

我想其余语言的入门教程都不会有这么一节: 这门语言的运做原理是怎么样的 . 但这么一节内容是 Scheme 的入门教程必有的. Scheme 把它最核心, 最底层的机制都提供出来给用户使用, 使它有很是强大的能力. 因此知道它的运行机理是很是重要的.

这一节和下一节都是在分析 Scheme 的运行原理. 在这一节中, 咱们会用一个太极图来分析一条 Scheme 语句是怎么被执行的. 在下一节, 咱们会在这一节的基础上引入 Scheme 的对象/内存管理机制. 从而获得一个比较完整的 Scheme 运行原理, 并用 Scheme 语言表示出来.

咱们先从 eval 和 apply 的用法提及. eval 接受一个参数, 结果是执行那个参数的语句, 而 apply 则接受两个参数, 第一个参数表示一个函数, 第二个参数是做用于这个函数的参数列表. 例如:

(eval '(+ 1 2))

(apply + '(1 2))

咱们能够轻易发现, 这二者是能够轻易转化的:

(define (eval exp) (apply (car exp) (cdr exp)))

(define (apply method arguments) (eval (cons method arguments)))

可是显然, 真正的实现不可能如此, 否则 eval 一次就没完没了地转圈了. 咱们在前面提到 Scheme 的基本运行逻辑, 其实也是 eval 的基本原理:

若是那是一个数, 则返回这个数
若是那是一个符号, 则返回该符号所绑定的对象.
若是那是一个列表, 把列表的第一项做为方法, 其余做为参数, 执行之.

咱们来实现一个这样的逻辑, 要注意的是, 下面的 eval 和 apply 的写法都只是说明概念, 并非真实可运行的. 但用 Scheme 写一个 Scheme 解释器是确实可行的:

(define (eval exp)

(cond

((number? exp) exp)

((symbol? exp) 返回 exp 所指的对象)

((list? exp) (apply (eval (car exp)) (cdr exp)))

(else 'error)))

在第三项, 咱们很天然地用了 apply 来实现. 注意 apply 接受的第一个参数必须是一个函数对象, 而不能是一个相似 add 的名字, 因此咱们要递归地调用 eval 解析出它的第一个参数. 那么 apply 要怎么实现呢? 咱们来看一个实例:

有定义: (define (add x y) (+ x y))

执行: (add x (+ y 1))

用 eval 执行它的时候, 会执行

(apply (lambda (x y) (+ x y)) '(x (+ y 1))).

在执行它的时候 , 为了运行它, 咱们要知道 add 和 x 表明什么, 咱们还得知道 (+ y 1) 的结果, 不然咱们的计算没法继续下去. 咱们用什么来求得这些值呢

--- 显然是eval. 所以 apply 的处理流程大体以下:

(define (apply method arguments)

(执行 method (map eval arguments)))

咱们获得的仍是一个互相递归的关系. 不过这个递归是有尽头的, 当咱们遇到原子对象时, 在 eval 处就会直接返回, 而不会再进入这个递归. 因此 eval 和 apply 互相做用, 最终把程序解释成原子对象并获得结果. 这种循环不息的互相做用, 能够表示为这样一个太极:

这就是一个 Scheme 解释器的核心.

然而, 咱们上面的模型是不尽准确的. 好比, (if cond if-part else-part) 把这个放入 apply 中的话, if-part 和 else-part 都会被执行一遍, 这显然不是咱们但愿的. 所以, 咱们须要有一些例外的逻辑来处理这些事情, 这个例外逻辑一般会放在 eval. (固然理论上放在 apply 里也能够, 你们能够试一下写, 不过这样在 eval 中也要有特殊的逻辑之处 "if" 这个符号所对应的值). 咱们能够把 eval 改为这样

(define (eval exp)

(cond

((number? exp) exp)

((symbol? exp) 返回 exp 所指的对象)

((list? exp)

(cond

((if? (car exp)) (if 的特殊处理 (cdr exp)))

(还有其余的例如 quote, cond 的都得放在这里)

(else (apply (eval (car exp)) (cdr exp)))))

(else 'error)))

这样咱们的逻辑就比较完整了.

另外 apply 也要作一些改动, 对于 apply 的 method, 它有多是相似 "+" 这样的内置的 method, 咱们叫它作 primitive-proceure, 还有由 lambda 定义的 method, 他们的处理方法是不同的.

(define (apply method arguments)

(if (primitive-procedure? method)

(处理内置函数 (map eval arguments))

(处理 lambda (map eval arguments))

在下一节, 咱们就会从 lambda 函数是怎么执行的讲起, 并再次修改 eval 和 apply 的定义, 使其更加完整. 在这里咱们会提到一点点 lambda 函数的执行原理, 这其实算是一个 trick 吧.

咱们这样定义 lambda 函数

(lambda (参数表) 执行体)

那么咱们在 apply 这个 lambda 函数的时候会发生什么呢? apply 会根据参数表和参数作一次匹配, 好比, 参数表是 (x y) 参数是 (1 2), 那么 x 就是 1, y 就是 2. 那么, 咱们的参数表写法其实能够很是灵活的, 能够试试这两个语句的结果:

((lambda x x) 1 2) <= 注意两个 x 都是没有括号的哦

((lambda (x . y) (list x y)) 1 2 3)

这样 "匹配" 的意义是否会更加清楚呢? 因为这样的机制, 再加上能够灵活运用 eval 和 apply, 可使 Scheme 的函数调用很是灵活, 也更增强大.

惟心主义的对象管理系统

关于对象

既然这一节咱们要讲对象管理系统. 咱们首先就要研究对象, 研究在 Scheme 内部是如何表示一个对象. 在 Scheme 中, 咱们的对象能够分红两类: 原子对象和 pair.

咱们要用一种办法惟一地表示一个对象. 对原子对象, 这没什么好说的, 1 就是 1, 2 就是 2. 可是对 pair, 状况就比较复杂了.

(define a '(1 . 2))

(define b '(1 . 2))

若是咱们修改了 a 的 car 的值, 咱们不但愿 b 的值也一样的被改变. 所以虽然 a 和 b 在 define 时的值同样, 但他们不是相同的对象, 咱们要分别表示他们. 可是在这个时候

(define a '(1 . 2))

(define b a)

a 和 b 应该指的是同一个对象, 否则 define 的定义就会很尴尬 (define 不是赋值, 而是绑定). 修改了 a 的 car, b 也应该同时改变.

答案很明显了: 对 pair 对象, 咱们应把它表示为一个引用 --- 熟悉 Java 的同窗也会知道一个相同的原则: 在 Java 中, 变量能够是一个原子值 (如数字), 或者是对一个复合对象的引用.

在这里咱们引入一组操做, 它能够帮助测试, 理解这样的对象系统:

set!: 不要漏了叹号, 修改一个符号的绑定
set-car!: 修改 pair 中左边值的绑定
set-cdr!: 修改 pair 中右边值的绑定
eq?: 测试两个对象是否相等
equal?: 测试两个对象的值是否相等.

咱们能够进行以下测试:

(define a '(1 . 2))

(define b '(1 . 2))

(set-car! a 3)

查看 a 和 b 的值

(define a '(1 . 2))

(define b a)

(set-car! a 3)

查看 a 和 b 的值

(eq? '(1 2) '(1 2))

(equal? '(1 2) '(1 2))

另外咱们能够想一想如下操做造成的对象的结构:

(define a '(1 2))

(define b (cons 3 (cdr a)))

它造成的结构应该是这样的

a: (1 2) - (2) - ()

b: (3 2) ---+

因此 (eq? (cdr a) (cdr b)) 的值应该是真.

lambda 的秘密

接下来咱们要研究: Scheme 是怎么执行一个 lambda 函数的? 运行一个 lambda 函数, 最重要的就是创建一个局部的命名空间, 以支持局部变量 --- 对 Scheme 来讲, 所谓局部变量就是函数的参数了. 只要创建好这样的一个命名空间, 剩下的事情就是在此只上逐条运行语句而已了.

咱们首先能够看这样的一个例子:

(define x 10)

((lambda (x) x) 20)

结果固然是 20, 这说明了 Scheme 在运行 lambda 函数时会创建一个局部的命名空间 --- 在 Scheme 中, 它叫作 environment, 为了与其余的资料保持一致, 我们会沿用这个说法, 并把它简写为 env. 并且这个局部 env 有更高的优先权 . 那咱们彷佛能够把寻找一个符号对应的对象的过程描述以下, 这也是 C 语言程序的行为:

先在函数的局部命名空间里搜索
若是找不到, 在全局变量中搜索.

可是 Scheme 中, 函数是能够嵌套的:

(define x 10)

(define (test x)

(define (test2 x) x)

(test2 (+ x x)))

(test 20)

很好, 这不就是一个栈的结构吗? 咱们在运行中维护一个 env 的栈, 搜索一个名称绑定时从栈顶搜索到栈底就能够了.

这在 Pascal 等静态语言中是可行的 (Pascal 也支持嵌套的函数定义). 可是在 Scheme 中不行 --- Scheme 的函数是能够动态生成的, 这会产生一些栈没法处理的状况, 好比咱们上面使用过的例子:

(define (make-iterator method step)

(lambda (x) (method x step)))

(define inc (make-iterator + 1))

(define dec (make-iterator - 1))

执行 inc 和 dec 的时候, 它执行的是 (method x step), x 的值固然很好肯定 , 可是method 和 step 的值就有点麻烦了. 咱们调用 make-iterator 生成 inc 和dec 的时候, 用的是不一样的参数, 执行 inc 和 dec 的时候, method 和 step 的值固然应该不同, 应该分别等于调用 make-iterator 时的参数. 这样的特性 , 就无法用一个栈的模型来解释了.

一个更使人头痛的问题是: 运行 lambda 函数时会创造一个 env, 如今看起来, 这个 env 不是一个临时性的存在, 即便是在函数执行完之后, 它都有存在的必要 , 否则像上例中, inc 在运行时就无法正确地找到 + 和 1 了. 这是一种咱们从未遇到的模型.

咱们要修改函数的定义. 在 Scheme 中, 函数不只是一段代码, 它还要和一个 environment 相连. 好比, 在调用 (make-iterator + 1) 的时候, 生成的函数要与执行函数 make-iterator 实时产生的 env 相连, 在这里, method = +, step = 1; 而调用 (make-iterator - 1) 的时候, 生成的函数是在与另外一个 env --- 第二次调用 make-iterator 产生的 env 相连, 在这里, method = -, step = 1. 另外, 各个 env 也是相连的. 在执行函数 inc 时, 他会产生一个含有名称 x 的 env, 这个 env 要与跟lambda 函数相连的的 lambda 相连. 这样咱们在只含有 x 的 env 中找不到method, 能够到与其相连的 env 中找. 咱们能够画图如下来执行 (inc 10) 时的 env 关系:

inc: ((x 10)) -> ((method +) (step 1)) -> ((make-iterator 函数体))

这里的最后一项就是咱们的全局命名空间, 函数 make-iterator 是与这个空间相连的.

因而咱们能够这样表示一个 env 和一个 lambda 函数对象: 一个 env 是这么一个二元组 (名称绑定列表与之相连的上一个 env). 一个 lambda 是一个这样的三元组: (参数表代码 env).

由此咱们须要修改 eval 和 apply. 解释器运行时, 须要一直保持着一个 "当前 env". 这个当前 env 应该做为参数放进 eval 和 apply 中, 并不断互相传递. 在生成一个 lambda 对象时, 咱们要这样利用 env:

(define (make-lambda 参数表代码 env)

(list 参数表代码 env))

这样就能够表示 lambda 函数与一个 env 的绑定. 那么咱们执行 lambda 函数的行为能够这么描述:

(define (make-env func)

(list (match-binding (car func) (caddr func))))

match-binding 就是咱们上面介绍过的参数表匹配过程.

(define (run-lambda func)

(let ((new-env (make-env func)))

(eval (cadr func) new-env)))

这样咱们就能够彻底清楚的解释 make-iterator 的行为了. 在执行 (make-iterator + 1) 时, make-env 生成了这样的一个 new-env:

(((method +) (step 1)) global-env)

global-env 是 (((make-iterator 函数体)) '())

这个 new-env 会做为参数 env 去调用 eval. 在 eval 执行到 lambda 一句时, 又会以这样的参数来调用 make-lambda, 所以这样的一个 env 就会绑定到这个 lambda 函数上. 同理, 咱们调用 (make-iterator - 1) 的时候, 就能获得另外一个 env 的绑定.

这种特性使 "函数" 在 scheme 中的含义很是丰富, 使用很是灵活, 如下这个例子实现了很是方便调试的函数计数器:

(define (make-counter method)

(let ((counter 0))

(lambda arguments

(if (eq? (car arguments) 'print)

counter

(begin

(set! counter (+ counter 1))

(apply method arguments))))))

(define add (make-counter +))

用普通的参数调用 add 时, 它会执行一个正常的加法操做. 但若是调用 (add 'print), 它就会返回这个函数被执行了多少次. 这样的一个测试用 wrapper 是彻底透明的. 正由于 scheme 函数能够与一个 env, 一堆值相关联, 才能实现这么一个功能.

自动垃圾收集

咱们的问题远未解决.

C 语言中, 局部变量放在栈中, 执行完函数, 栈顶指针一改, 这些局部变量就全没了. 这好理解得很. 但根据咱们上面的分析, Scheme 中的函数执行完后, 它创造的 env 还不能消失. 这样的话, 不就过一会就爆内存了么......

因此咱们须要一个自动垃圾收集系统, 把用不着的内存空间所有收回. 你们可能都是在 Java 中接触这么一个概念, 但自动垃圾收集系统的祖宗实际上是 LISP, Scheme 也继承了这么一个神奇的系统.

自动垃圾收集系统能够以一句惟心主义的话来归纳: 若是你无法看到它了, 它就不存在了. 在 Java 中, 它彷佛是一个很神奇的机制, 但在 Scheme 中, 它却简单无比.

咱们引入上下文的概念: 一个上下文 (context), 包括当前执行的语句, 当前 env, 以及上一个与之相连的 context --- 如咱们所知, 在调用 lambda 函数时 , 会产生一个新的 env, 但其实它也产生一个新的 context, 包括了 lambda 中的代码, 新的 env, 以及对调用它的 context 的引用 (这就比如在 x86 中调用 CALL 指令压栈的当前指令地址, 在使用 RET 的时候能够弹出返回正确的地方 ). 它是这样的一个三元组: (code env prev-context). 任什么时候候, 咱们都处于一个这样的上下文中.

引入这个概念, 是由于一个 context, 说明了任何咱们可以访问和之后可能会访问的对象集合: 正要运行的代码固然是咱们能访问的, env 是全部咱们可以访问的变量的集合, 而 prev-context 则说明了咱们之后可能可以访问的东西: 在函数执行完毕返回后, 咱们的 context 会恢复到 prev-context, prev-context 包含的内容是咱们之后可能访问到的.

如上所述, code, env, 以及 context 自己均可以描述为标准的 LIST 结构, 那咱们所谓能 "看到" 的对象, 就是当前 context 这个大表中的全部内容. 其他的东西, 都是垃圾, 要被收走.

好比, 咱们处在 curr-context 中, 调用 (add 1 2). 那会产生一个新的 new-context, 在执行完 (add 1 2) 后, 咱们又回到了 curr-context, 它与 new-context 不会有任何的联系 --- 咱们不管如何也不可能在这里访问到执行 add 时的局部变量. 因此执行 add 时产生的 env 之类, 都会被看成垃圾收走.

当咱们使用的内存多于某个阈值, 自动垃圾收集机制就会启动. 有了上面的介绍 , 咱们会发现这么个机制简单的不值得写出来: 当前的 context 是一个 LIST, 遍历这个 LIST, 把里面的全部对象标记为有用. 而后遍历所有对象, 把没有标记为有用的对象所有当垃圾回收, 完了. 固然真实实现远远不是如此, 会有不少的优化, 但它的基本理论就是如此.

好了, 咱们要再一次修改 eval, apply 和 run-lambda 的实现, 此次要怎么改动你们都清楚得很了.

经过此次修改, 咱们也能够解释自动处理尾递归为何是可行的. 咱们在上面举出了一个尾递归的例子:

(define (iterate x)

(if (= x 10)

(iterate (+ x 1))))

(iterate 0)

在 C 语言中, 再新的新手也不会写这种狂吃内存的愚蠢代码, 但在 Scheme 中, 它是很合理的写法 --- 由于有自动垃圾收集.

在每次调用函数的时候, 咱们能够作这样的分析, iterate 的递归调用图以下:

(iterate 0) -> (iterate 1) -> (iterate 2) ....

| ^ | ^ |

----+ +----------+ +-------------+

下面的箭头表示函数返回的路径. 若是咱们每次的递归调用都是函数体中的最后一个语句, 就说明: 好比从 (interate 2) 返回到 (iterate 1) 时, 咱们什么都不用干, 又返回到 (iterate 0) 了. 在 iterate 中, 咱们每一层递归都符合这个条件, 因此咱们就给它一个捷径:

(iterate 0) -> (interate 1) -> ... (interate 10)

<-----------------------------------------+

让他直接返回到调用 (iterate 0) 以前. 在实现上, 咱们能够这么作: 好比, 咱们处在 (iterate 0) 的 context 中, 调用 (iterate 1). 咱们把 (iterate 1) 的 context 中的 prev-context 记为 (iterate 0) 的 prev-context, 而不是 (iterate 0) 的 context, 就能造成这么一条捷径了. 咱们每一层递归都这么作, 能够看到, 其实每一层递归的 context 中的 prev-context 都是调用 (interate 0) 以前的 context! 因此其实执行 (interate 10) 的时候, 与前面的 context 没有任何联系, 前面递归产生的 context 都是幽魂野鬼, 内存不足时随时能够回收, 所以不用担忧浪费内存. 而 Scheme 自动完成分析并构造捷径的过程, 因此在 Scheme 中能够用这样的递归去实现迭代而保持高效.

面向对象的 Scheme

咱们能够这样定义一个对象: 对象就是数据和在数据之上的操做的集合.

Scheme 中的 lambda 函数, 不但有代码, 还和一个 environment, 一堆数据相连 --- 那不就是对象了么. 在 Scheme 中, 确实能够用 lambda 去实现面向对象的功能. 一个基本的 "类" 的模板是相似这样的:

(define (make-object 初始化参数)

(let ((成员变量1 初始值 1) (成员变量2 初始值 2) ...)

(define (成员函数1 参数表)

blablabla)

....

(lambda (cmd . args)

(cond

((eq? cmd 接口名1) (apply 成员函数1 args))

....))))

使用

(define obj (make-object blabla))

(obj 接口名参数)

这样就能很方便地把它和其余语言中的对象对应起来了.

Scheme 虽然没有真正的, 复杂的面向对象概念, 没有继承之类的咚咚, 但 Scheme 可以实现更灵活, 更丰富的面向对象功能. 好比, 咱们前面举过的 make-counter 的例子, 它就是一个函数调用计数器的类, 并且, 它能提供彻底透明的接口, 这一点, 其余语言就很难作到了.

创造机器的机器

真实存在的时光机器

在上一节中, 咱们引入了 context 的概念, 这个概念表明 scheme 解释器在任什么时候刻的运行状态. 若是咱们有一种机制, 可以把某个时候的 context 封存起来, 到想要的时候, 再把它调出来, 这必定会很是有趣 --- 对, 就像游戏中的存档同样. 若是真有这样的机制, 那就简直是真实存在的时光机器了.

Scheme 还真的有这个机制 --- 它把 context 也当作一个对象, 能够由用户自由地使用, 这使咱们能完成不少 "神奇" 的事情. 在上一节, 咱们为了方便理解, 使用了 "context" 这一叫法, 在这里, 咱们恢复它的正式称呼 --- 这一节, 咱们研究 continuation.

咱们仍是从它的用法提及, continuation 的使用从 call-with-current-continuation 开始, 这个名字长得实在难受, 咱们按惯例一概缩写为 call/cc. call/cc 能够这样使用

(call/cc (lambda (cont) blablablabla))

它接受一个函数做为参数, 而这个函数的参数就是这个 continuation 对象. 我们要怎么用这个对象呢? 如下是一个最简单的例子:

(+ 1 (call/cc (lambda (cont) (cont 2))))

你们能够试试它的结果, 与 (+ 1 2) 相同. 这里最重要的一句是 (cont 2). 我们从一开始就说, Scheme 中的一切都是函数, 在上一节中咱们知道, 为了执行一个函数, 咱们建立一个 context (continuation), 那 context 的行为的最终结果就是返回一个值了. 而 (cont 2) 这样用法至关因而给 cont 这个 continuation 下个断言: 这个 context(continuation) 的返回值就是 2, 不用再往下算了 --- 咱们也能够这么想象, 当解释器运行到 (cont 2) 的时候, 就把整个 (call/cc ....) 替换成 2, 因此获得咱们要的结果.

没什么特别, 对吧. 但这一点点已经能有很重要的应用 --- 个人函数有不少条语句 (这在 C 等过程式语言中很常见, 在 Scheme 这类语言中却是少见的), 我想让它跑到某个点就直接 return; 我须要一个像 try ... catch 这样的例外机制, 而不想写一个 N 层的 if. 上面的 continuation 用法就已经能作到了, 大家能够试试写一个 try ... catch 的框架, 很简单的.

老实说, 上面这个一点都不像时光机, 也不见得有多强大. 咱们再来点好玩的:

(define g-cont '())

(let ((x (call/cc

(lambda (cont) (set! g-cont cont)))))

(if (number? x) (+ x x)))

以上这些语句固然不会有执行结果, 由于 call/cc 没有返回任何值给 x, 在 if 语句以后就没法继续下去了. 不过, 在这里咱们把这个 continuation 保存成了一个全局变量 g-cont. 如今咱们能够试试: (g-cont 10). 你们能够看到结果了 : 这才是时光机啊, 经过 g-cont, 咱们把解释器送回从前, 让 x 有了一个值, 而后从新计算了 let 之中的内容, 得出咱们所要的答案.

这样的机制固然不只仅是好玩的, 它能够实现 "待定参数" 的功能: 有的函数并不能直接被调用, 由于它的参数可能由不一样的调用者提供, 也可能相隔很长时间才分别提供. 但不管如何, 只要参数一齐, 函数就要立刻获得执行 --- 这是一种很是常见的模块间通信模式, 但用普通的函数调用方法没法实现, 其余方法也很难实现得简单漂亮, continuation 却使它变得很是简单. 好比

(define (add x y)

(if (and (number? x) (number? y)) (display (+ x y))))

(define slot-x '())

(define slot-y '())

(add (call/cc (lambda (cont) (set! slot-x cont)))

(call/cc (lambda (cont) (set! slot-y cont))))

到咱们用相似 (slot-x 10) 的形式提供完整的 x y 参数值后, add 就会正确地计算. 在这里, add 不用担忧是谁, 在何时给它提供参数, 而参数的提供者也没必要关心它提供的数据是给哪一个函数, 哪段代码使用. 这样, 模块之间的耦合度就很低, 而依然能简单, 准确地实现功能. 实在非 continuation 不能为也.

不过要注意的是, continuation 并非真的如游戏的存档通常 --- 咱们知道 continuation 的实现, 一个 continuation 只不过是一个简单的对象指针, 它不会真的复制保存下所有运行状态. 咱们保存下一个 continuation, 修改了全局变量, 而后再回到那个 continuation, 全局变量是不会变回来的. 有了前一章的知识, 你们很清楚什么才会一直在那里不被改动 --- 这个 continuation 所关联的私有 env 才是不会被改动的.

既然有时光机的特性, continuation 会是一个强力的实现回溯算法的工具. 咱们能够用 continuation 保存一个回溯点, 当咱们的搜索走到一个死胡同, 能够退回上一个保存的回溯点, 选择其余的方案.

比方说, 在 m0 = (4 2 3) 和 m1 = (1 2 3) 中搜索一个组合, 使 m0 < m1, 这是一个很是简单的搜索问题. 咱们递归地先选一个 m0 的值, 再选一个 m1 的值 , 到下一层递归的时候, 因为没有东西可选了. 因此咱们检验是否 m0 < m1, 如果是, 退出, 不然就回溯到上一回溯点, 选择下一个值.

回溯点的保存固然是用 continuation, 咱们不但要在一个尝试失败时使用 continuation 做回溯, 还须要在获得正确答案时用 continuation 跳过层层递归, 直接返回答案.

因此, 咱们有这样的一个过程:

(define (search-match . ls)

(define (do-search fix un-fix success fail)

(if (null? un-fix)

(if (< (car fix) (cadr fix))

(success fix)

(fail))

(choose fix (car un-fix) (cdr un-fix) success fail)))

(call/cc

(lambda (success)

(do-search '() ls success

(lambda () (error "Search failed"))))))

当 un-fix 为空时, 说明全部值都已经选定, 咱们就能够检验值并选择下一步动做. 吸引咱们的是 choose 的实现, choose 要作的工做就是在 un-fix 中的第一项里选定一个值, 放到 fix 中, 而后递归地调用 do-search 进入下一层递归 . 在 C 中, 它的工做是用循环完成的, 在 Scheme 中, 它倒是这么一个递归的过程:

(define (choose fix to-fix un-fix success prev-fail)

(if (null? to-fix)

(prev-fail)

(begin

(call/cc

(lambda (fail)

(do-search (append fix (list (car to-fix))) un-fix

success fail)))

(choose fix (cdr to-fix) un-fix success prev-fail))))

咱们在上面说过将一个循环转换成递归的过程, 如今你们就要把这个递归从新化为咱们熟悉的循环了. (prev-fail) 至关于 C 中循环结束后天然退出, 这退到了上一个回溯点. 而下面 call/cc 的过程在递归 do-search 的时候建立了一个回溯点. 好比, 在 do-search 中运行 (fail), 就会回溯回这里, 递归地调用 choose 来选定下一个值.

你们能够写出相应的 C 程序进行对照, 应该可以理解到 fail 参数在这里的使用. 其实这样回溯实现确实是比较啰嗦的 --- 可是, 若是咱们能不写任何代码, 让机器自动完成这样的搜索计算呢?

简言之, 咱们只须要一个函数

(define (test a b) (< a b))

而后给定 a, b 的可选范围, 而后系统就告诉咱们 a b 的值, 咱们不用关心它是怎么搜索出来的.

有这东西么? 在 Scheme 中请相信奇迹, 用 continuation 能够方便地实现这样的系统. 下面, 咱们要介绍这个系统, 一个 continuation 的著名应用 --- amb 操做符实现非肯定计算.

amb 操做符是一个通用的搜索手段, 它实现这样一个非肯定计算: 一个函数有若干参数, 这些参数并无一个固定的值, 而只给出了一个可选项列表. 系统能自动地选择一个合适的组合, 以使得函数能正确执行到输出合法的结果.

咱们用 (amb 1 2 3) 这样的形式去提供一个参数的可选项, 而 (amb) 则表示没有可选项, 计算失败. 因此, 所谓一个函数能正确执行到输出合法结果, 就是指函数能返回一个肯定值或一个 amb 形式提供的不肯定值; 而函数没有合法结果, 或是计算失败, 就是指函数返回了 (amb). 系统能自动选择/搜索合适的参数组合, 使函数执行到合适的分支, 避免计算失败, 到最后正确输出结果 --- 其实说了这么多, 就是一个对函数参数组合的搜索 --- 不过它是全自动的. 好比:

(define (test-amb a b)

(if (< a b)

(list a b)

(amb)))

(test-amb (amb 4 2 3) (amb 1 2 3))

有了上面的基础, 咱们知道用 continuation 但是方便地实现它, amb 操做其实是上面的搜索过程的通用化. 不一样的是, 在这里, 给出可选参数的形式更加自由 , 像上面把参数划分为 fix 和 un-fix 的方法不适用了.

咱们使用一个共享的回溯点的栈来解决问题. 在执行 (amb 4 2 3) 的时候, 我们就选定 4, 而后设置一个回溯点, 压入栈中, 执行 (amb 1 2 3) 时也如此 . 而当计算失败要从新选择时, 咱们从栈中 POP 出回溯点来跑. 咱们注意 (amb 1 2 3) 选择完 3 以后的状况, 在上面的 search-match 实现中, 这至关于 choose 中的 (prev-fail) 语句. 可是 (amb 1 2 3) 并不知道 (amb 4 2 3) 的存在, 没法这么作, 而借助这个共享栈, 咱们能够得到 (amb 4 2 3) 的回溯点, 使计算继续下去. 用这样的方法, 咱们就无须使用严密控制的 fix 和 un-fix, 可以自由使用 amb.

咱们的整个实现以下, 过程并不复杂, 不过确实比较晦涩, 因此也附带了注释:

(define fail-link '()) ; fail continuation 栈

;; amb-fail 在失败回溯时调用, 它另栈顶的 fail continuation 出栈

;; 并恢复到那个 continuation 中去

(define (amb-fail)

(if (null? fail-link)

(error "amb process failed")

(let ((prev (car fail-link)))

(set! fail-link (cdr fail-link))

(prev))))

(define (amb . ls)

(define (do-amb success curr)

(if (null? curr)

(amb-fail) ; 没有可选项, 失败

(begin

(call/cc

(lambda (fail)

(set! fail-link (cons fail fail-link)) ;设置回溯

;; 返回一个选项到须要的位置

(success (car curr))))

;; 回溯点

(do-amb success (cdr curr)))))

(call/cc

(lambda (success)

(do-amb success ls))))

咱们能够再敲入上面 test-amb 那段程序看看效果. 咱们发现, 其实咱们写 (amb) 的时候, 作的就是上面 search-match 实现中的 (fail), 那么整个过程又能够套回到上面的实现上去了. 以上程序的执行流程分析有点难, 呵呵, 准备几张草稿纸好好画一下就能明白了.

终章的名实之辩

================= End

1. scheme 之门
2. MIT-Scheme 安装入门
3. Scheme
4. [Scheme]一个Scheme的Metacircular evaluator
5. iOS 开发之 URL Scheme
6. iOS 唤起APP之URL Scheme
7. url scheme
8. URL Scheme
9. Scheme 初步
10. scheme 学习
更多相关文章...
• Memcached入门教程 - NoSQL教程
• Neo4j数据库入门教程 - NoSQL教程
• YAML 入门教程
• 互联网组织的未来：剖析GitHub员工的任性之源

scheme 之门

scheme 之门

开始以前

数据结构的本质论

世界的终极问题

开始编程啦

无处不在的函数

基本的函数概念

无名的能量之源

一些经常使用的函数

cond

循环语句

更多的数据操做

无始无终的太极

惟心主义的对象管理系统

关于对象

lambda 的秘密

自动垃圾收集

面向对象的 Scheme

创造机器的机器

真实存在的时光机器

终章的名实之辩