闭包是由函数及其相关引用环境组合而成的实体(即:闭包=函数+引用环境)。
闭包是函数式语言中的概念,没有研究过函数式语言的用户可能很难理解闭包的强大,相关的概念超出了本书的范围。Go语言是支持闭包的,这里只是简单地讲一下在Go语言中闭包是如何实现的。
func f(i int) func() int { return func() int { i++ return i } }
函数f返回了一个函数,返回的这个函数,返回的这个函数就是一个闭包。这个函数中本身是没有定义变量i的,而是引用了它所在的环境(函数f)中的变量i。
c1 := f(0) c2 := f(0) c1() // reference to i, i = 0, return 1 c2() // reference to another i, i = 0, return 1
c1跟c2引用的是不同的环境,在调用i++时修改的不是同一个i,因此两次的输出都是1。函数f每进入一次,就形成了一个新的环境,对应的闭包中,函数都是同一个函数,环境却是引用不同的环境。
变量i是函数f中的局部变量,假设这个变量是在函数f的栈中分配的,是不可以的。因为函数f返回以后,对应的栈就失效了,f返回的那个函数中变量i就引用一个失效的位置了。所以闭包的环境中引用的变量不能够在栈上分配。
在继续研究闭包的实现之前,先看一看Go的一个语言特性:
func f() *Cursor { var c Cursor c.X = 500 noinline() return &c }
Cursor是一个结构体,这种写法在C语言中是不允许的,因为变量c是在栈上分配的,当函数f返回后c的空间就失效了。但是,在Go语言规范中有说明,这种写法在Go语言中合法的。语言会自动地识别出这种情况并在堆上分配c的内存,而不是函数f的栈上。
为了验证这一点,可以观察函数f生成的汇编代码:
MOVQ $type."".Cursor+0(SB),(SP) // 取变量c的类型,也就是Cursor PCDATA $0,$16 PCDATA $1,$0 CALL ,runtime.new(SB) // 调用new函数,相当于new(Cursor) PCDATA $0,$-1 MOVQ 8(SP),AX // 取c.X的地址放到AX寄存器 MOVQ $500,(AX) // 将AX存放的内存地址的值赋为500 MOVQ AX,"".~r0+24(FP) ADDQ $16,SP
识别出变量需要在堆上分配,是由编译器的一种叫escape analyze的技术实现的。如果输入命令:
go build --gcflags=-m main.go
可以看到输出:
./main.go:20: moved to heap: c ./main.go:23: &c escapes to heap
表示c逃逸了,被移到堆中。escape analyze可以分析出变量的作用范围,这是对垃圾回收很重要的一项技术。
回到闭包的实现来,前面说过,闭包是函数和它所引用的环境。那么是不是可以表示为一个结构体呢:
type Closure struct { F func()() i *int }
事实上,Go在底层确实就是这样表示一个闭包的。让我们看一下汇编代码:
func f(i int) func() int { return func() int { i++ return i } } MOVQ $type.int+0(SB),(SP) PCDATA $0,$16 PCDATA $1,$0 CALL ,runtime.new(SB) // 是不是很熟悉,这一段就是i = new(int) ... MOVQ $type.struct { F uintptr; A0 *int }+0(SB),(SP) // 这个结构体就是闭包的类型 ... CALL ,runtime.new(SB) // 接下来相当于 new(Closure) PCDATA $0,$-1 MOVQ 8(SP),AX NOP , MOVQ $"".func·001+0(SB),BP MOVQ BP,(AX) // 函数地址赋值给Closure的F部分 NOP , MOVQ "".&i+16(SP),BP // 将堆中new的变量i的地址赋值给Closure的值部分 MOVQ BP,8(AX) MOVQ AX,"".~r1+40(FP) ADDQ $24,SP RET ,
其中func·001是另一个函数的函数地址,也就是f返回的那个函数。
Copyright© 2013-2020
All Rights Reserved 京ICP备2023019179号-8