前言.
打从敲下"Hello World!",咱们算入行了。我开始写代码,和用计算器差不多:
输入:1 + 1
结果:2
…
代码一路顺着走,不开叉。
生涯第 1 个波折,是学到条件判断,像这样:
a = 1,b = 1
if a + b = 2 print "这都知道?"else print “答对了”
代码开始有不同走向,有点绕,还能驾驭。
再后来就遇到人生大哉问:妈和媳妇一起掉河里,你救谁?
翻译一下,如何同时运行代码 A 和代码 B(并行)?
为一起救,我学过各种泳姿:
开始用 “定时器/软中断”挺好,不过随着媳妇数(代码块)的增多,猝!
后来折腾“事件驱动/状态机”,就活在连跳/回调地狱里,最终为个 delay 而累猝!
最后“多线程”还行…还活着。
焦头烂额,终于 hold 住。
可人生问题哪止这些,后来更大问题是 3 字:“没钱”
“多线程”虽好,太费钱(资源消耗大)、太折腾(竞争成本高),很多场景受限:
浏览器:没有多线程
嵌入式 MCU:实时性要求高、RAM 受限,甚至没有 RTOS
大链接数 server:微信后台
游戏:魔兽世界
吐血。
小品文已过,咱们言归正传。
1.
近些年,很多编程语言都修订标准,新增 2 个关键字 async/await:
直接包含:C#/JavaScript/Rust/Dart
其它语言(golang/erlang/lua…)没直接包含,也提供类似机制 ,比如 Go goroutine
所有目的,都是为更好的支持异步编程,不约而同的加强 Coroutine。
Coroutine(协程)是老东西(比 UNIX 都早),近些年的广泛使用有其背景:
大量线程用不起(服务器或嵌入式),或者没有线程(浏览器或 MCU 裸机)
然而,异步需求在,开源库 API 设计成异步 IO 渐变主流
可异步代码太难搞,程序一膨胀,不是回调地狱就是全程乱跳。。。
由此不约而同想:代码能不能写起来像同步,跑起来像异步?
做梦之余一看,这不是就是 Coroutine 吗?好好,不止第三方库,要语言层支持,加 promise,再加 async/await
嗯,这段像瞎掰,实际是典型 JavaScript 开发者心态,其它也类似。
远的不说,做嵌入式开发,也常被异步 IO 编程(基于中断/消息/事件)搞得焦头烂额,我也想要“Code like sync, works like async”。
可 C/C++如何做 Coroutine 呢?
2.
方案 1:
基于用户态 Scheduler(微信后台方案)
Coroutine 是简单的东西,第一反应就是拿用户态 Scheduler 实现。
即任务切换时,完成真实的换栈:
任务运行上下文(context)可以简视:寄存器/栈信息,当每个协程任务放弃(yield)时,执行 context 切换。看起来和 OS 线程没区别,实际是有的:
所有 Coroutines 共享 1 个 CPU 线程,相互无抢占(协作式,竞争成本低)
Coroutine 更轻,尽管 Linux 中单线程只需约 4KB(1 页),然而 1 个 Coroutine 只 0.1KB
Coroutine 切换快(约 100T),在多数平台上消耗时间在纳秒级/微秒级
对大量链接的服务器后台,上述优势明显。可以参见腾讯开源协程库: libco。
这是对调用者干净的实现,编程没有限制,PC 端主流协程库都如此实现:
libco(微信)/Boost.Context(C++准标准)/libaco/coroutine
换栈的手段也不局限汇编,有系统库或第三方:
posix 中 context/Windows 中 fiber/C 标准中 setjump 等。
尽管如此,可对嵌入式编程意义很小:
RTOS 中 Task 实现类似,内存消耗/切换成本已经很低
RTOS 中 Task 亦可配置成协作式(非抢占)
每种 CPU 都需要移植,等价于再实现 Scheduler,意义不大
方案 2:
基于标签语法糖(switch 或 goto 扩展)
这是借用预编译宏和标签,大玩语法游戏的套路。
目前所有类似实现(如 Protothread),都基于 Simon Tatham 的文章,这里简要 1 种核心:
仔细看上述代码,它是合法的。在 switch/case 间,插入不同的语句,用不同 case 分割。由此换个视角看,count 可视为状态索引,每次进入时会恢复到代码对应位置。这是一种不基于换栈的任务切出/切回方式。
把上述 switch/case 手段用宏 crBegin/crFinish/crReturn 包装下,下面两段带 while(1)的死循环代码,就可以在 1 个线程中并发执行:
这是 Coroutine 实现的最轻方式,优点:
完全标准 C 实现,跨平台
每个 Coroutine 只需要额外 1 字节 - 2 字节内存
Task 切换无成本
不过,不知道大家发没发现,局部变量该怎么办?
没有换栈,无法用局部变量,必须 static 静态化。由此,这种方式受限明显:
如果用 static 变量,会导致函数无法重入
如果不用 static,就必须传参类似 ctx 参数来代替局部变量
看的出来,让调用者有些难受。
由此,Contiki OS 又对上述方法改良并包装,并用这种机制实现整个操作系统的多任务。
它的代码值得一读,除了这部分,其它模块(uIP/GUI/Timer/Mem)都很漂亮。
3.
大家看的出来,嵌入式系统上 1 和 2 还不够完美,有没有更好的方案?希望:
只用 C99 实现,完全跨平台/跨架构
内存消耗要远小于线程,额外消耗在几个字节内
可以使用局部变量(至少表面上)
对调用者友好,类似其它语言 async/await 的方式
显然需要新方案。
这里卖个关子,感兴趣的朋友可以留言讨论,请持续关注我们公众号哦~
作者介绍:
王相宇,滴滴两轮车硬件技术部
本文转载自公众号普惠出行产品技术(ID:gh_ed6841067977)。
原文链接:
Code Like Sync, Works Like Async
评论