Common Lisp中有一个叫作return
的宏,它的做用和日常在C、Java,或者Node.js里面见到的return
关键字彻底不同。Common Lisp中的return
用于从一个块(block
)中返的,而不是从一个函数中返回。用return
能够写出下面这样的代码,符号YOU-WILL-NOT-SEE-ME
永远不会被打印html
(defun foo () (block nil (return 123) (print 'you-will-not-see-me)))
求值return
,就将123做为block
的返回值从中返回了,后面的print
并无机会执行——在SBCL中编译上面这段defun
的时候,编译器甚至已经给出了提醒git
return
是一个宏,它能够展开为一个return-from
,并带有一个名为NIL
的块名。用return-from
能够直接从函数foo
中返回而不须要多一层block
,示例代码以下github
(defun foo2 () (return-from foo2 123) (print 'you-will-not-see-me))
除了要多写一个函数的名称以外,return-from
跟C、Java,或者Node.js中的return
语句是差很少的——没错,只是差很少而已。实际上,return-from
也是从一个block
中返回的,上面的代码之因此有效,是由于defun
会隐式地定义一个跟函数同名的块。app
这一次要在jjcc2
中支持的return
,比起Common Lisp,更接近于C语言中的return
语句——是用来直接从函数调用中返回的。ide
编译return
其实很简单。在目前的inside-out
中,return
会落入到最后的分支,所以它的惟一一个参数会被翻出来先编译,而且其结果是放入到%EAX
寄存器中的。因此,编译return
只须要生成一道简单的RET
指令就足够了。修改后的jjcc2
以下函数
(defun jjcc2 (expr globals) "支持两个数的四则运算的编译器" (check-type globals hash-table) (cond ((eq (first expr) '+) `((movl ,(get-operand expr 0) %eax) (movl ,(get-operand expr 1) %ebx) (addl %ebx %eax))) ((eq (first expr) '-) `((movl ,(get-operand expr 0) %eax) (movl ,(get-operand expr 1) %ebx) (subl %ebx %eax))) ((eq (first expr) '*) ;; 将两个数字相乘的结果放到第二个操做数所在的寄存器中 ;; 由于约定了用EAX寄存器做为存放最终结果给continuation用的寄存器,因此第二个操做数应当为EAX `((movl ,(get-operand expr 0) %eax) (movl ,(get-operand expr 1) %ebx) (imull %ebx %eax))) ((eq (first expr) '/) `((movl ,(get-operand expr 0) %eax) (cltd) (movl ,(get-operand expr 1) %ebx) (idivl %ebx))) ((eq (first expr) 'progn) (let ((result '())) (dolist (expr (rest expr)) (setf result (append result (jjcc2 expr globals)))) result)) ((eq (first expr) 'setq) ;; 编译赋值语句的方式比较简单,就是将被赋值的符号视为一个全局变量,而后将eax寄存器中的内容移动到这里面去 ;; TODO: 这里expr的second的结果必须是一个符号才行 ;; FIXME: 不知道应该赋值什么比较好,先随便写个0吧 (setf (gethash (second expr) globals) 0) (values (append (jjcc2 (third expr) globals) ;; 为了方便stringify函数的实现,这里直接构造出RIP-relative形式的字符串 `((movl %eax ,(get-operand expr 0)))) globals)) ;; ((eq (first expr) '_exit) ;; ;; 由于知道_exit只须要一个参数,因此将它的第一个操做数塞到EDI寄存器里面就能够了 ;; ;; TODO: 更好的写法,应该是有一个单独的函数来处理这种参数传递的事情(以符合calling convention的方式) ;; `((movl ,(get-operand expr 0) %edi) ;; (movl #x2000001 %eax) ;; (syscall))) ((eq (first expr) '>) ;; 为了能够把比较以后的结果放入到EAX寄存器中,以我目前不完整的汇编语言知识,能够想到的方法以下 (let ((label-greater-than (intern (symbol-name (gensym)) :keyword)) (label-end (intern (symbol-name (gensym)) :keyword))) ;; 根据这篇文章(https://en.wikibooks.org/wiki/X86_Assembly/Control_Flow#Comparison_Instructions)中的说法,大于号左边的数字应该放在CMP指令的第二个操做数中,右边的放在第一个操做数中 `((movl ,(get-operand expr 0) %eax) (movl ,(get-operand expr 1) %ebx) (cmpl %ebx %eax) (jg ,label-greater-than) (movl $0 %eax) (jmp ,label-end) ,label-greater-than (movl $1 %eax) ,label-end))) ((eq (first expr) 'if) ;; 假定if语句的测试表达式的结果也是放在%eax寄存器中的,因此只须要拿%eax寄存器中的值跟0作比较便可(相似于C语言) (let ((label-else (intern (symbol-name (gensym)) :keyword)) (label-end (intern (symbol-name (gensym)) :keyword))) (append (jjcc2 (second expr) globals) `((cmpl $0 %eax) (je ,label-else)) (jjcc2 (third expr) globals) `((jmp ,label-end) ,label-else) (jjcc2 (fourth expr) globals) `(,label-end)))) ((member (first expr) '(_exit exit)) ;; 暂时以硬编码的方式识别一个函数是否来自于C语言的标准库 `((movl ,(get-operand expr 0) %edi) ;; 据这篇回答(https://stackoverflow.com/questions/12678230/how-to-print-argv0-in-nasm)所说,在macOS上调用C语言函数,须要将栈对齐到16位 ;; 伪装要对齐的是栈顶地址。由于栈顶地址是往低地址增加的,因此只须要将地址的低16位抹掉就能够了 (and ,(format nil "$0x~X" #XFFFFFFFFFFFFFFF0) %rsp) (call :|_exit|))) ((eq (first expr) 'return) ;; 因为通过inside-out的处理以后,return的参数就是一个“原子”了,所以再也不须要调用jjcc2来处理一遍 `((movl ,(get-operand expr 0) %eax) (ret))) (t ;; 按照这里(https://www3.nd.edu/~dthain/courses/cse40243/fall2015/intel-intro.html)所给的函数调用约定来传递参数 (let ((instructions '()) (registers '(%rdi %rsi %rdx %rcx %r8 %r9))) (dotimes (i (length (rest expr))) (if (nth i registers) (push `(movq ,(get-operand expr i) ,(nth i registers)) instructions) (push `(pushq ,(get-operand expr i)) instructions))) ;; 通过一番尝试后,我发现必须在完成函数调用后恢复RSP寄存器才不会致使段错误 `(,@(nreverse instructions) (pushq %rsp) (and ,(format nil "$0x~X" #XFFFFFFFFFFFFFFF0) %rsp) (call ,(first expr)) (popq %rsp))))))
如今,就不须要老是依靠exit
函数来退出了。下列的代码可使用RET
指令从_main
函数中返回测试
(fb '(return (+ 1 2)))
生成的汇编代码以下编码
.data G565: .long 0 .section __TEXT,__text,regular,pure_instructions .globl _main _main: MOVL $1, %EAX MOVL $2, %EBX ADDL %EBX, %EAX MOVL %EAX, G565(%RIP) MOVL G565(%RIP), %EAX RET
全文完。spa
阅读原文rest