协程(coroutine)学习笔记

2018-10-26  本文已影响0人  Jiafu

什么是协程(coroutine)

Wiki定义:

Coroutines are computer program components that generalize subroutines for non-preemptive multitasking, by allowing execution to be suspended and resumed.
协同程序是一种计算机程序组件,它通过允许暂停和恢复执行,将子程序泛化以实现非抢占式的多任务处理。

我的理解是协程是一种轻量级线程,也是一种调度的单位,只是这种调度是用户(或者当前线程)主动进行的,操作系统感知不到。
每个协程拥有自己的执行上下文,当需要让出执行的时候,协程就把当前的上下文(寄存器、栈等等)保存起来,然后把其他协程的上下文恢复,以达到切换的目的。这种切换是完全在用户态进行,所以切换的性能比较髙。线程的切换需要进内核,所以性能慢一些,通常比协程慢一个数量级。

协程 vs 线程

Stackfull协程 vs stackless协程

Stackless类型不保存调用栈以及寄存器等信息,不属于真正的重入,因此一些局部变量都是无法使用的。

Stackfull是真正的基于栈的重入,可以从某个嵌套的调用点上恢复执行。Stackfull协程在切换的时候,需要把当前的栈保存起来,以便在恢复的时候再次恢复执行,而stackless的则不需要。

对称(symmetric) vs 非对称(asymmetric)

协程依控制转移机制分为对称与非对称,对称协程中所有的协程都只有一种控制转移语义,即将控制转移至其他协程,此中的协程在这种机制下都是对称的。而非对称协程中调用者协程与被调用协程处于不对称的地位,和函数调用一样,被调用协程挂起之后控制总是会转移到调用者协程。

协程优点

个人理解,协程的唯一优点
目前看来,协程最主要的优点,就是可以使用同步的方式写异步执行的代码,使得代码逻辑更加简洁和清晰。

但是协程实际上还是无法完全避免写异步回调,因为我们需要在异步API的基础上,结合协程库,开发出“同步”的API。

很多文章中提出,协程的性能更高,个人觉得这个结论有待商榷。协程由于常常是自己实现的,所以自己实现的代码质量对性能有很大影响。另外抛开业务模式去谈性能,也不是很合理。再者,很多人说线程的切换怎么样怎么样的,协程可以有成千上万个,线程成千上万个就怎么样的,我觉得也很不客观。因为实际上,我们实现的时候,线程数通常都是固定的,或者是跟CPU核数有一定关系的,比如CPU核数是8,那么线程数可以也是8,甚至可以做到线程和CPU绑定,那么这个线程切换本身就是一个小概率事件,甚至理论上如果没有别的线程在跑,我们的线程可以做到不切换,所以根本就没有切换性能这一说。

协程的应用场景

我觉得协程的应用场景可能对于一些非常底层的,例如内核驱动、存储、数据库这样的应用,未必是合适的。而对于一些比较上层的应用,例如即时通信软件,可能是比较合适的。

协程有什么风险?

协程对于我们团队来说有没有必要?

鉴于以上对协程的优缺点的分析,我个人认为,协程对我们团队来说,的确是一个可选项,可以考虑在比较上层(性能要求不是非常严苛)的场景下使用,会在一定程度上加快开发的速度。但协程对于我们来说,远远达不到必选项的条件。

目前我们的大部分基础库都是采用异步的方式实现的,我们的大部分业务代码,也是异步的,也就是用到了各种回调。其实难度也并没有想象那么大,类似的代码写习惯了,其实也挺简单的。后端的业务流程,个人觉得,写异步代码的困难程度,并不是瓶颈所在。

Implement in C

Simon Tatham通过C语言的宏,实现了一种协程,参考这里。通过这个例子可以学习到协程的一些定义。不过上面的实现很难直接用在生产环境,一方面它会对已有的源码有一些冲突,需要对现有的代码进行重构。另一方面它在宏里有一些malloc的动作,生产环境中可能不一定允许有这样的操作。

基于ucontext的实现

风云主要直接使用了现成的ucontext族的接口,这个接口从调研来看,主要的缺点在于性能慢,因为用到了系统调用。另外这个版本用到的是共享栈的做法。

代码量非常少,比较直观,不过基本上没有做错误处理,要用于生产环境的话,需要自己再改一下。代码托管在:https://github.com/cloudwu/coroutine/

C的另外一个实现:
http://xmailserver.org/libpcl.html

上一篇 下一篇

猜你喜欢

热点阅读