python之嵌套函数与闭包
函数基础
关于函数基础,可以查看我的另一篇博客:http://yunjianfei.iteye.com/blog/2186064
与本文相关的,有两个重要概念:变量作用域(scope)与生命周期(lifetime)
如果对于这两个概念有所疑惑,可以先去了解一下。
嵌套函数
python是允许创建嵌套函数的,也就是说我们可以在函数内部定义一个函数,这些函数都遵循各自的作用域和生命周期规则。
#!/usr/bin/env python def outer(): x = 1 def inner(): print x # 1 inner() # 2 outer()
输出结果:
这个例子比普通的函数定义看起来复杂了一点,实际上都是很合理的。
1. #1的地方,python寻找名为x的local变量,在inner作用域内的locals中寻找不到,python就在外层作用域中寻找,其外层是outer函数。x是定义在outer作用域范围内的local变量。
2. #2的地方,调用了inner函数。这里需要特别注意:inner也只是一个变量名,是遵循python的变量查找规则的(Python先在outer函数的作用域中寻找名为inner的local变量)
函数在python中是first-class对象
上面这句话看着有点抽象,简单点来说,在python中所有的东西都是对象,函数也是对象,看下面的代码:
#!/usr/bin/env python a = 1 print a.__class__ print issubclass(a.__class__, object) # all objects in Python inherit from a common baseclass def foo(): pass print foo.__class__ # 1 print issubclass(foo.__class__, object)
输出结果:
True
<type 'function'>
True
可以看到foo和变量a一样,都是*父类object的子类。a是一个int变量,foo是一个函数。
所以,函数没有什么特殊的,它和python里的其他东西一样,都属于对象,其父类是object。这意味着,
1. 函数和其他变量是一样,变量是可以传递和修改值的,函数也可以作为变量
2. 函数也可以作为函数的参数或者函数的返回值。
如下的例子:
#!/usr/bin/env python def add(x, y): return x + y def sub(x, y): return x - y def apply(func, x, y): # 1 return func(x, y) # 2 print apply(add, 2, 1) # 3 print apply(sub, 2, 1)
执行结果
1
这个例子中,add和sub就是两个普通的函数对象。#1中,func这个参数用来接收函数变量(和其他参数接收变量一样)。在#2处,用来执行func参数传递进来的函数。在#3处,我们把add函数作为参数传递给apply,在apply中执行,并返回结果。
再看一个例子:
#!/usr/bin/env python def outer(): def inner(): print "Inside inner" return inner # 1 foo = outer() #2 print foo foo()
输出结果:
Inside inner
1. 在#1处, 我们返回了inner变量(这个变量是函数标签)。
注意:这里并没有去调用inner,调用的话是inner()
2. 在#2处,我们将outer函数返回的结果赋值给foo变量,foo返回的是inner函数的标签(注意输出结果), 概念类似c语言中的函数指针
3. 最后执行foo的时候,实际上执行的是inner。
以上的例子充分说明,函数完全可以看做是变量,可以把它赋值给其他变量,且有变量作用域、变量生存周期等。
闭包(Closures)
再来看一个例子:
#!/usr/bin/env python def outer(): x = 1 def inner(): print x # 1 return inner foo = outer() print foo.func_closure #2 doctest: +ELLIPSIS foo()
输出结果:
在这个例子中,我们可以看到inner函数作为返回值被outer返回,然后存储在foo变量中,我们可以通过foo()来调用它。但是真的可以跑起来吗?让我们来关注一下作用域规则。
python里运行的东西,都按照作用域规则来运行。
1. x是outer函数里的local变量
2. 在#1处,inner打印x时,python在inner的locals中寻找x,找不到后再到外层作用域(即outer函数)中寻 找,找到后打印。
看起来一切OK,那么从变量生命周期(lifetime)的角度看,会发生什么呢:
1. x是outer的local变量,这意味着只有outer运行时,x才存在。那么按照python运行的模式,我们不能在 outer结束后再去调用inner。
2. 在我们调用inner的时候,x应该已经不存在了。应该发生一个运行时错误或者其他错误。
但是这一些都没有发生,inner函数依旧正常执行,打印了x。
Python支持一种特性叫做函数闭包(function closures):在非全局(global)作用域中定义inner函数(即嵌套函数)时,会记录下它的嵌套函数namespaces(嵌套函数作用域的locals),可以称作:定义时状态,可以通过func_closure 这个属性来获得inner函数的外层嵌套函数的namespaces。(如上例中#2,打印了func_closure ,里面保存了一个int对象,这个int对象就是x)
注意:每次调用outer函数时,inner函数都是新定义的。上面的例子中,x是固定的,所以每次调用inner函数的结果都一样。
下面我们看一个不同的例子:
#!/usr/bin/env python def outer(x): def inner(): print x # 1 return inner print1 = outer(1) print2 = outer(2) print print1.func_closure print1() print print2.func_closure print2()
输出结果:
1
(<cell at 0x147d3360: int object at 0x146b2cf0>,)
2
在这个例子中,我们能看到闭包实际上是记录了外层嵌套函数作用域中的local变量。通过这个例子,我们可以创建多个自定义函数。
思维扩展一下,上面这个例子,很容易让人想到面向对象编程:
1. outer是inner的构造器
2.x是inner的一个私有变量
这里主要是帮助读者理解闭包的概念,
下面附上几个链接,帮助更好的理解:
http://ynniv.com/blog/2007/08/closures-in-python.html
http://www.shutupandship.com/2012/01/python-closures-explained.html