“ Golang号称云计算时代的C语言,是非常值得研究的一门语言”
本文是笔者在初学Golang的时候,学习的一些新的分享。现在开一个系列,Golang究竟怎么回事系列?谈Goroutine,谈数据结构,不仅语言语义理解,还要更深入的,更本质的看到,Golang的数据结构到底是怎么回事?
其中,使用到gdb,dlv等调试工具,有此经验的更佳。(旁白:这也是我更喜欢Golang的原因,可以使用gdb拨开云雾,看到最本质的东西)
思考几个问题
前面有两篇介绍协程的文章:
从简单的讲起,协程是什么?
协程是什么?
协程就是用户态的最小调度执行单位,类比理解就是用户态线程,本质就是用户态自己切换cpu,在协程这一层我们基本可以把线程和cpu等同起来。(旁白:协程这个执行体操作系统是不认识的,只有用户自己认识,所以你用pstack看线程的工具是看不了协程的)
协程应用场景?
(旁白:协程两个用法:1)框架同步改造异步 2)异步代码写成同步样子)
协程的调度实现一般有哪几种样式?
协程最根本的就两种类型:
对称的调度方式
每个协程任务都是一样的,不存在主次,都可以相互切换。这类调度类型看着美观,但是实现起来会非常复杂,如果加上一些协程锁,异步io切换逻辑之后,而且极容易出错。不容易实现时序的串行化。
非对称的调度方式
最典型的就是有一个中心调度任务。主要角色分为:
基本原则:
有哪些常见的协程实现?
Linux提供了协程库,可以基于以下这四个调用实现协程切换
#include <ucontext.h>
void makecontext(ucontext_t *ucp, void (*func)(), int argc, ...);
int swapcontext(ucontext_t *oucp, const ucontext_t *ucp);
int getcontext(ucontext_t *ucp);
int setcontext(const ucontext_t *ucp);
或者你可以自己保存,交换寄存器栈环境:
怎么实现一个简易的协程调度?
上图是一个比较完整的切换示意图:
以上就是实现的一个简单的协程调度的原理。当然具体细节会有很多,状态修改,协程生命周期,校验逻辑。比如必须:
协程上最重要的准则是什么?
协程任务上一定不能跑阻塞的任务调用。一定要确保cpu不停的转。因为所有的协程当前本质上是不支持抢占任务的,因为没有时间片的概念。一旦阻塞,会导致这个线程执行所有的任务阻塞。
协程要配套哪些东西?
前面复习完了协程通用的知识,下面终于到了重点戏码——Golang的协程是怎么回事? (旁白:协程实现很简单,就四板斧:任务,队列,切换上下文的手段,代码执行者)
G-P-M的数据结构
作为Go的最大宣传特点,来看看goroutine的协程实现。goroutine本质上和上面我实现的协程是一样的。但是由于做了一些层次抽象,更具灵活性。
其中启动开始P就是固定的,M是会增长的,M执行任务必须是绑定到一个P(也就是说,一定要有一个队列),没有绑定到P的M就是空闲的,或者游离态的。这样数据结构(P)和执行(M)分离增加了扩展性。
举两个例子:
1 . 如果M被阻塞,这个时候,队列里面所有的G都是要移交出去的,之前会存在比较复杂的操作。GMP架构,只需要M释放P,空闲的M去接管P就行了。
2 . 如果当前M执行完了P队列的所有任务,那么也不会空闲等待,而是会尝试去steal其他的G。先尝试从全局队列里获取,没有获取到,那么再去随机挑选一个P队列,拿走部分的G。(worke-steal)
这个GMP的设计是在Go1.1之后加入的:https://docs.google.com/document/d/1TTj4T2JO42uD5ID9e89oa0sLKhJYD0Y_kqxDv3I3XMw/edit#heading=h.mmq8lm48qfcw
提一下:go里面实现一些并发同步操作的时候,很多都是使用原子操作来替代锁,从而减少消耗,这个值得我们学习。
有些特殊的M,比如sysmon是不绑定P的。这个用于监控一些阻塞的异常情况,比如一个M长时间阻塞超过10ms,那么强制把M-P解绑,把M游离出去,P绑定到一个空闲的M上,继续执行队列里的G任务。
// The bootstrap sequence is:
//
// call osinit
// call schedinit
// make & queue new G
// call runtime·mstart
//
// The new G calls runtime·main.
初始化的时候,会创建几个线程(M)
(旁白:goroutine有runtime的运行逻辑)
创建goroutine
接口
newproc
goroutine的调度跟之前我实现的协程调度核心是一致的,但是由于是多了一个抽象层(GPM),灵活性和扩展性大大提高。
步骤一:用来创建goroutine的结构
type funcval struct {
fn uintptr
// variable-size, fn-specific data here
}
注意:特意标红的地方,这里是goroutine调度的一个关键。在goroutine执行完fn函数之后,在执行ret汇编指令的时候,会把这个地址取出来放到指令计数器(pc)去执行,而这个地址恰好是goexit的地址。这个赋值就是在newproc的时候赋值的。执行了goexit,你才能切回调度里(非对称中心化调度)。
newproc -> newproc1 -> gostartcallfn
步骤二: newproc是在systemstack的包装下调用的,这个调用保证newproc的函数执行是在调度协程的栈里面(M.g0栈)
// func systemstack(fn func())
TEXT runtime·systemstack(SB), NOSPLIT, $0-8
...
// 切换到调度: switch to g0
MOVQ DX, g(CX)
MOVQ (g_sched+gobuf_sp)(DX), BX
SUBQ $8, BX
MOVQ $runtime·mstart(SB), DX
MOVQ DX, 0(BX)
MOVQ BX, SP
// 执行函数:call target function
MOVQ DI, DX
MOVQ 0(DI), DI
CALL DI
// 切回原来的协程:switch back to g
MOVQ g(CX), AX
MOVQ g_m(AX), BX
MOVQ m_curg(BX), AX
MOVQ AX, g(CX)
MOVQ (g_sched+gobuf_sp)(AX), SP
MOVQ $0, (g_sched+gobuf_sp)(AX)
这个就符合中心调度的设计思想。解释几个函数调用-
runqget // goroutine 出队
runqput // goroutine 入队
runqgrab // goroutine 抢占
G入队的几个优先级:
2 . runqputslow a . sched.runq 全局队列 (p队列满了就会溢出到全局队列,p队列256个槽位)
newproc -> newproc1 -> systemstack ( runqput )
步骤三:执行goroutine
调度接口入口
<pre class="code-snippet__js" data-lang="nginx">```
<span class="code-snippet_outer" style="font-size: 14px;">schedule
流程就是:
1. 从队列里获取到G
a . 从P队列里获取G任务
b . 第二优先级从其他地方获取
2 . 切入执行
这里提到一点细节就是:go的调度机制是,当执行了n(61)个任务之后,必须要去全局列表获取G任务,保证公平执行。
具体切入执行某个G
execute -> gogo
其中gogo的代码
![](https://oss-cn-hangzhou.aliyuncs.com/codingsky/cdn/img/2021-08-01/4ed41e57cbe31d1ded213f6262c7f1c2)
**goroutine的抢占调度**
goroutine本质上是没有抢占式的调用,只是会在goroutine结构体上加上一个标记。因为没有时间片。只有当有机会调用到特定的调用的时候,才可能发生切出。
**goroutine的自动扩容**
1. 编译器分析判断是否可能会导致2kb的栈溢出,如果可能,那么就会在函数的汇编代码前后加上指令代码
a . 前面——判断是否栈溢出
b . 后——栈扩容调用morestack
(旁白:自动扩容的触发机制也被复用在抢占调度了)
**goroutine的主动切出**
1. Gosched : 把当前G放入到队列中,然后切出
2. gopark/goparkunlock : 保存上下文,直接切出
3. goready : 唤醒G(把G重新入队)
Copyright© 2013-2020
All Rights Reserved 京ICP备2023019179号-8