在计算机科学中,闭包(英语:Closure),又称词法闭包(Lexical Closure)或函数闭包(function closures),是引用了自由变量的函数。这个被引用的自由变量将和这个函数一同存在,即使已经离开了创造它的环境也不例外。
[维基百科::闭包(计算机科学)]
0x02 Python 中的函数式编程 本来也应该包括闭包的概念,但是我觉得闭包更重要的是对作用域(Scope)的理解,因此把它单独列出来,同时可以理顺一下 Python 的作用域规则。
闭包的概念最早出现在函数式编程语言中,后来被一些命令式编程语言所借鉴。尤其是在一些函数作为一等公民的语言中,例如JavaScript就经常用到(在JavaScript中函数几乎可以当做“特等公民”看待),我之前也写过一篇关于JavaScript闭包的文章(图解Javascript上下文与作用域),实际上闭包并不是太复杂的概念,但是可以借助闭包更好地理解不同语言的作用域规则。
命名空间与作用域
0x00 The Zen of Python的最后一句重点强调命名空间的概念,我们可以把命名空间看做一个大型的字典类型(Dict),里面包含了所有变量的名字和值的映射关系。在 Python 中,作用域实际上可以看做是“在当前上下文的位置,获取命名空间变量的规则”。在 Python 代码执行的任意位置,都至少存在三层嵌套的作用域:
- 最内层作用域,最早搜索,包含所有局部变量(Python 默认所有变量声明均为局部变量)
- 所有包含当前上下文的外层函数的作用域,由内而外依次搜索,这里包含的是非局部也非全局的变量
- 一直向上搜索,直到当前模块的全局变量
- 最外层,最后搜索的,内置(built-in)变量
在任意执行位置,可以将作用域看成是对下面这样一个命名空间的搜索:
1 2 3 4 5 6 |
scopes = { "local": {"locals": None, "non-local": {"locals": None, "global": {"locals": None, "built-in": ["built-ins"]}}}, } |
除了默认的局部变量声明方式,Python 还有global
和nonlocal
两种类型的声明(nonlocal
是Python 3.x之后才有,2.7没有),其中 global
指定的变量直接指向(3)当前模块的全局变量,而nonlocal
则指向(2)最内层之外,global
以内的变量。这里需要强调指向(references and assignments)的原因是,普通的局部变量对最内层局部作用域之外只有只读(read-only)的访问权限,比如下面的例子:
1 2 3 4 5 |
x = 100 def main(): x += 1 print(x) main() |
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 |
--------------------------------------------------------------------------- UnboundLocalError Traceback (most recent call last) in () 3 x += 1 4 print(x) ----> 5 main() in main() 1 x = 100 2 def main(): ----> 3 x += 1 4 print(x) 5 main() UnboundLocalError: local variable 'x' referenced before assignment |
这里抛出UnboundLocalError
,是因为main()
函数内部的作用域对于全局变量x
仅有只读权限,想要在main()
中对x
进行改变,不会影响全局变量,而是会创建一个新的局部变量,显然无法对还未创建的局部变量直接使用x += 1
。如果想要获得全局变量的完全引用,则需要global
声明:
1 2 3 4 5 6 7 8 |
x = 100 def main(): global x x += 1 print(x) main() print(x) # 全局变量已被改变 |
1 2 |
101 101 |
Python 闭包
到这里基本上已经了解了 Python 作用域的规则,那么我们来仿照 JavaScript 写一个计数器的闭包:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 |
""" /* JavaScript Closure example */ var inc = function(){ var x = 0; return function(){ console.log(x++); }; }; var inc1 = inc() var inc2 = inc() """ # Python 3.5 def inc(): x = 0 def inner(): nonlocal x x += 1 print(x) return inner inc1 = inc() inc2 = inc() inc1() inc1() inc1() inc2() |
1 2 3 4 |
1 2 3 1 |
对于还没有nonlocal
关键字的 Python 2.7,可以通过一点小技巧来规避局部作用域只读的限制:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 |
# Python 2.7 def inc(): x = [0] def inner(): x[0] += 1 print(x[0]) return inner inc1 = inc() inc2 = inc() inc1() inc1() inc1() inc2() |
1 2 3 4 |
1 2 3 1 |
上面的例子中,inc1()
是在全局环境下执行的,虽然全局环境是不能向下获取到inc()
中的局部变量x
的,但是我们返回了一个inc()
内部的函数inner()
,而inner()
对inc()
中的局部变量是有访问权限的。也就是说inner()
将inc()
内的局部作用域打包送给了inc1
和inc2
,从而使它们各自独立拥有了一块封闭起来的作用域,不受全局变量或者任何其它运行环境的影响,因此称为闭包。
闭包函数都有一个__closure__
属性,其中包含了它所引用的上层作用域中的变量:
1 2 |
print(inc1.__closure__[0].cell_contents) print(inc2.__closure__[0].cell_contents) |
1 2 |
[3] [1] |