若是程序中的函数仅接受输入并产生输出,即输出只依赖于输入,数据不可变,避免保存程序状态,那么就称为函数式编程(Functional Programming,简称FP,又称泛函编程)。javascript
这种风格也称声明式编程(Declarative Programming),与之相对的是指令式编程(Imperative Programming),后者中的对象会不断修改自身状态。函数式编程强调程序的执行结果比执行过程更重要,倡导利用若干简单的执行单元让计算结果不断渐进,逐层推导复杂的运算,而不是设计一个复杂的执行过程。html
函数编程语言最重要的基础是λ演算(lambda calculus),并且λ演算的函数能够接受函数看成输入(引数)和输出(传出值)。java
函数式编程历史悠久,最古老的例子莫过于1958年被创造出来的LISP了。而随着程序结构复杂,面向对象编程大行其道。近年来,简洁并且特别适合计算任务的函数式编程又从新崛起,不只仅是纯粹的函数式语言如Haskell、Clojure等,各类流行语言javascripts、python、Objective-C、C#.Net甚至Java都纷纷吸取函数式编程的部分形式。并且,不只仅是计算任务,近年还出现了用FP编写的UI应用程序,如LightTable等。python
本文做者@申导 主要采用Python语言为例,是由于它虽然不是纯粹的FP,但Python可以胜任各类编程形式,简洁优雅,通俗易懂。特别适合从主流语言转过来的学习者。git
纯函数指的是没有反作用(内存或I/O)的函数,函数会返回新值,而不会修改原来的值。函数间无共享变量(不像面向对象)。github
来看个非函数式的例子,它改变了变量的值。shell
int cnt; void inc() { cnt++; }
函数式的例子,不改变变量的值,而是返回一个新值。express
int cnt; int inc() { return cnt+1; }
这个特色能够用来优化代码。例如,一个无反作用的纯函数,其执行结果具备不变性,那么其执行结果就能够缓存起来,供下次调用。再好比,两个互不依赖的纯函数,其执行顺序能够互换,甚至并行地执行而无需互斥。编程
在python中,不可变的元组(tuple)数据结构特别适合函数式编程。缓存
在FP中,首要特色就是将函数视为一等公民,函数能够当作参数来进行传递,造成所谓的高阶函数,形如 z=g(f(x),y),还能像变量同样被建立和修改。
这种形式在非纯粹的函数式编程语言里面多有吸取,用于简化语法。连最古板的面向对象语言Java也终于在Java8中引入了lambda。
读者若是使用过C语言,必定记得标准库中的快排函数,其中第4个参数是一个函数指针,用于传入一个比较(compare)函数,而排序动做被抽象成了一个模板函数。这就是一个典型的高阶函数:qsort(compare(items))
void qsort(void *items, size_t nitems, size_t size, int (*compare)(const void *, const void*));
使用lambda能够定义简单的单行匿名函数。lambda的语法以下:lambda args: expression
lambda_add = lambda x, y: x + y def normal_add(x,y): return x+y assert lambda_add(2,3) == normal_add(2,3)
匿名λ函数与使用def定义的函数彻底同样,可使用lambda_add做为函数名进行调用。然而,提供lambda的目的是为了编写偶尔为之的、简单的、可预见不会被修改的匿名函数。
考虑一个求和的例子,通常会采用循环:
def my_sum(numbers): total = 0 for x in numbers: total = total + x return total my_sum(range(1, 100))
若是再求乘积呢?
def my_product(numbers): total = 1 for x in numbers: total = total * x return total my_product(range(1, 100))
想到DRY原则,上述两段函数存在了很多重复。咱们看到除了初始值和运算符不一样,其实总体的流程是差很少的,那么概括(reduce)一下如何?
def my_reduce(numbers, function, initial): total = initial for x in numbers: total = function(total, x) return total my_reduce(range(1, 100), lambda t,x: t+x, 0) my_reduce(range(1, 100), lambda t,x: t*x, 1)
Python内置的reduce(function, iterable[, initializer])函数已经实现了对列表元素依次概括的场景,而内置的all(),any(),sum(),max(),min()等函数都是基于它衍生而来。
Python内置函数还有map(function, iterable, ...)了,它抽象了另外一种情景,即遍历列表中的每一个元素,对每一个元素执行传入的函数,并返回包含全部新元素的新列表。
而zip(iterable1, iterable2, ...)函数则对多个列表进行合并,每一个列表的第n个元素组成一个元组(tuple),而后返回包含这些元组的新列表
filter(function, iterable)函数的功能是遍历列表,若是以元素做为参数调用function时返回True的话则将其过滤出来,最后返回包含全部过滤出的元素的新列表。
有了这些内置函数,你的代码会变得更简洁,没有了循环体,数据集,操做,返回值都放到了一块儿。特别是用了reduce()之后,连for,while循环都省了。
再看个例子,咱们有3辆车比赛,简单起见,咱们分别给这3辆车有70%的几率能够往前走一步,一共有5次机会,咱们打出每一次这3辆车的前行状态。用指令式编程的代码以下:
from random import random time = 5 car_positions = [1, 1, 1] while time: # decrease time time -= 1 print '' for i in range(len(car_positions)): # move car if random() > 0.3: car_positions[i] += 1 # draw car print '-' * car_positions[i]
若是改用函数式或称指令式编程,则是这样的:
from random import random L = [0]*3 reduce(lambda ll,_: map(lambda x:(x+1) if random() > 0.3 else x, ll), range(5), L)
再看看用FP模拟Unix下的echo命令:
def monadic_print(x): print x return x echo_FP = lambda: monadic_print(raw_input("FP -- "))=='quit' or echo_FP() echo_FP()
柯里化(Currying)技术是把接受多个参数的函数变换成只接受部分参数(好比原函数的第一个参数)的函数,而且返回接受余下的参数的新函数,新函数称为偏函数。
形如:f(x,y) ==> f(x)(y)
Python不像Scala语言那样支持Currying。然而稍做变通便可达到生成偏函数的效果:
def add(x, y): return x + y def add_to(n): return lambda x: add(n, x) assert add(3, 2) == add_to(3)(2)
但Python内置的functools模块提供了一个函数partial,能够为任意函数生成偏函数:
functools.partial(func[, *args][, **keywords])
import functools f3 = functools.partial(add, 3) assert add(3, 2) == f3(2)
若是一个函数定义在另外一个函数的做用域内,而且引用了外层函数的变量,则该函数称为闭包。下例中inner()就是一个闭包,自己是一个函数,并且能够访问(在python2.x中是只读的)自己以外的变量n。
def f(): n = 1 def inner(): print n return inner f()()
Python的Decorator(函数装饰器)在功能上相似Java的函数注解(Annotation)。它首先是个闭包,存放了fn及自定义的变量。而后再返回一个wrapper函数,真正对fn及fn的参数进行AOP处理。若是要使用带参数的decorator还须要多包裹一层,先返回一个保存着decorator参数的闭包,再返回一个保存了fn的闭包。
看一个通俗的计算函数运行时间的例子,其中对于运行时间的统计与原功能作到了分离:
import time def timeit(func): def wrapper(): start = time.clock() func() end =time.clock() print 'used:', end - start return wrapper @timeit def foo(): print 'in foo()' foo()
再看一个计算斐波那契数列的例子,每次递归都会有重复计算,若是能讲中间结果记录下来就能够提升性能。(增长了可选的 @warps 是为了不一些反作用,好比func.name等属性保持为原函数的名字而非wrapper,防止采用反射时遇到问题。)
from functools import wraps def memo(fn): cache = {} miss = object() @wraps(fn) def wrapper(*args, **kwargs): result = cache.get(args, miss) if result is miss: result = fn(*args) cache[args] = result return result return wrapper @memo def fib(n): if n < 2: return n return fib(n - 1) + fib(n - 2)
实质上,@decorator写法实际上是高阶函数的语法糖,每一次装饰都生成了一个新的函数。下例中的两种写法是等价的:
@decorator_one @decorator_two def fn(): pass func = decorator_one(decorator_two(fn)) #=================== @decorator_one(arg1, arg2) @decorator_two def fn(param1): pass func = decorator_one(arg1, arg2) (decorator_two (fn) )
在FP中,一般经过递归来实现循环。递归函数会不断调用自身,直到到达最基本的条件。
看个用线性递归代替循环来求和的例子(从1…5循环):
def lsum(f, a, b): if (a>b): return 0 else: return f(a)+lsum(f, a+1, b) print lsum(lambda x:x, 1, 5)
因为每次线性递归(Linear Recursive)调用都须要维护一个栈(stack),来保存临时状态,所以大量递归会带来性能问题,可是利用尾递归(Tail Recursive)能够进行优化,每次递归经过传参的方式来传递状态,减小stack占用。若是编译器支持的话,还能够将递归形式展开优化为while循环的形式(目前Python编译器暂不支持该优化)。下例中变量acc在每次递归后都会将最新状态带入下一次递归。
def tsum(f, a, b): def loop(a, acc): if a>b: return acc else: return loop(a+1, acc+f(a)) return loop(a,0) print tsum(lambda x:x, 1, 5)
FP语言能够分为严格(及早)求值与非严格(惰性)求值,区别在于对表达式求值的时机。看下面这个例子:
print len([2+1, 3*2, 1/0, 5-4])
在Python中执行上述语句会报错,由于以0为除数是非法的。能够看出Python对于数值运算是严格求值的,而像Haskell的默认方式就是非严格求值,于是上述语句的执行结果就是4,即列表的长度。
而Python中也存在惰性求值的语法,好比相对于range(n)函数,xrange(n)是其惰性版本。
再如相对于列表生成器[x+1 for x in range(5)],惰性版本能够写成(x+1 for x in range(5))。你能够print一下,看看二者的区别。
只要实现了__next__()函数的类,均可成为迭代器,每次调用next()函数,就应当返回序列中的下一个值。内置的数据结构如tuple、list、dict、set等都已经实现了迭代器。
对于列表,for循环一般是以遍历迭代器的形式,好比要从1~5循环,能够写成:
for i in [1,2,3,4,5]: pass
对于列表,若是还想得到循环的索引,能够这样写:
for i, index in enumerate([1,2,3,4,5]): pass
对于字典,能够这样遍历:
for k, v in {'a':1, 'b':2}.items(): pass
内置的itertools库提供了更有效更丰富的迭代器,包括去重、笛卡尔积、无限迭代、条件迭代。同时还有各类内置函数的惰性版本,好比相对于map()的imap()等。
开源库Fn.py库也实现了无限序列等。
列表生成器可用来快速生成列表,能够代替map()或filter()的使用。(注意例子中用的是严格求值的方式,不然还须要一次遍历才能展开列表)
好比下例中的写法是等价的:
[x+1 for x in range(5)] map(lambda x:x+1, range(5)) [x for x in range(10) if x%2==0] filter(lambda x:x%2==0, range(10))
若是是多重循环解析,则能够写成:(注意例子中能够用惰性求值的方式)
((x, y) for x in range(3) for y in range(x))
若是是组合循环解析,则能够写成:(注意例子中能够用惰性求值的方式)
(x for x in (y.doSomething() for y in lst) if x>0)
生成器是一个特殊的迭代器,须要用到yield关键字。包含该关键字的函数会自动成为一个生成器对象。里面的代码通常是一个有限或无限循环结构,每当调用该函数时,会执行到yield代码为止并返回本次迭代结果。而后冻结(freeze)在这一行,直到外部调用者的下一次调用该函数时,再返回下一次迭代结果。经过这种方式,迭代器能够实现惰性求值。
看一个用生成器来计算斐波那契数列的例子。其中求值函数是一个无限循环的生成器,而外部调用该生成器时,须要显式地控制迭代次数。
def fibonacci(): a = b = 1 yield a yield b while True: a, b = b, a+b yield b for num in fibonacci(): if num > 100: break print num,
另外一例是牛顿法开平方根,而每次迭代都会更加逼近真实值。下例是生成器与尾递归两种写法的比较,其中生成器内是一个有条件循环。(”_”是合法变量名,用做变量占位符,最后一行的reduce至关于for循环的做用)
def square(k): guess=1 yield guess while abs(guess*guess-k)>0.001: guess=(guess+k/guess)/2.0 yield guess return for z in square(2): print z def improve(guess, k): return (guess+k/guess)/2.0 print reduce(lambda guess, _: improve(guess, 2), range(4), 1)
再看一个中序(inorder)遍历二叉树的例子,里面用到了生成器的递归嵌套:
class Tree: def __init__(self,left, label, right) : self.left = left; self.label = label; self.right = right; def inorder(t): if t is not None: for x in inorder(t.left): yield x yield t.label for x in inorder(t.right): yield x def make_tree(array): if len(array) == 1: return Tree(None, array[0], None) return Tree(make_tree(array[0]), array[1], make(array[2])) tree = make_tree([[['a'], 'b', ['c']], 'd', [['e'], 'f', ['g']]]) print [n for n in inorder(tree)]
函数嵌套调用,看起来没有那么清爽。若是能将数据当作流,函数之间像shell里面的管道同样来传递数据,结果会更清楚一些。下段代码示例揭示了其中的原理,经过在装饰器中重载__ror__运算符(从右向左进行”或”操做)而且返回一个迭代器来作到这一点,因而,函数也就能够经过|运算符来互相操做了。
class Pipe(object): def __init__(self, func): self.func = func def __ror__(self, other): def generator(): for obj in other: if obj is not None: yield self.func(obj) return generator() @Pipe def even_filter(num): return num if num % 2 == 0 else None @Pipe def multiply_by_three(num): return num*3 @Pipe def convert_to_string(num): return 'The Number: %s' % num @Pipe def echo(item): print item return item def force(sqs): for item in sqs: pass nums = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10] force(nums | even_filter | multiply_by_three | convert_to_string | echo)
这正是开源库pipe.py所实现的管道式调用/流式操做。这种方式也比较适合参数校验、判空等场景。pipe.py的用法更加简洁一些:
from pipe import * range(5) | add fibonacci() | where(lambda x: x % 2 == 0) | take_while(lambda x: x < 10000) | add @Pipe def take_while_idx(iterable, predicate): for idx, x in enumerate(iterable): if predicate(idx): yield x else: return fibonacci() | take_while_idx(lambda x: x < 10) | as_list
用pipe和itertools从新实现一下以前的赛车题目:
from random import random from pipe import * import itertools print itertools.count(1) | take(5) | aggregate(lambda ll,_: ll | select(lambda x:(x+1) if random() > 0.3 else x), initializer=[0]*3) | as_list
[1] Python函数式编程
http://www.jackyshen.com/2014/10/02/functional-programming-in-Python/
[2] Python函数式编程指南:目录和参考
http://www.cnblogs.com/huxi/archive/2011/07/15/2107536.html
[3] Fn.py:享受Python中的函数式编程
http://www.infoq.com/cn/articles/fn.py-functional-programming-python
[4] 函数式编程
http://coolshell.cn/articles/10822.html
[5] Python修饰器的函数式编程
http://coolshell.cn/articles/11265.html
[6] 可爱的 Python : Python中函数式编程,第一部分
http://www.oschina.net/translate/python-functional-programming-part1
[7] 尾递归
http://baike.baidu.com/view/1439396.htm
[8] 手把手介绍函数式编程:从命令式重构到函数式