协程和通道是 Go 语言作为并发编程语言最为重要的特色之一,初学者可以完全将协程理解为线程,但是用起来比线程更加简单,占用的资源也更少。通常在一个进程里启动上万个线程就已经不堪重负,但是 Go 语言允许你启动百万协程也可以轻松应付。如果把协程比喻成小岛,那通道就是岛屿之间的交流桥梁,数据搭乘通道从一个协程流转到另一个协程。通道是并发安全的数据结构,它类似于内存消息队列,允许很多的协程并发对通道进行读写。

第 11 课 —— 千军万马跑协程 - 图1

Go 语言里面的协程称之为 goroutine,通道称之为 channel。

协程的启动

Go 语言里创建一个协程非常简单,使用 go 关键词加上一个函数调用就可以了。Go 语言会启动一个新的协程,函数调用将成为这个协程的入口。

  1. package main
  2. import "fmt"
  3. import "time"
  4. func main() {
  5. fmt.Println("run in main goroutine")
  6. go func() {
  7. fmt.Println("run in child goroutine")
  8. go func() {
  9. fmt.Println("run in grand child goroutine")
  10. go func() {
  11. fmt.Println("run in grand grand child goroutine")
  12. }()
  13. }()
  14. }()
  15. time.Sleep(time.Second)
  16. fmt.Println("main goroutine will quit")
  17. }
  18. -------
  19. run in main goroutine
  20. run in child goroutine
  21. run in grand child goroutine
  22. run in grand grand child goroutine
  23. main goroutine will quit

main 函数运行在主协程(main goroutine)里面,上面的例子中我们在主协程里面启动了一个子协程,子协程又启动了一个孙子协程,孙子协程又启动了一个曾孙子协程。这些协程之间似乎形成了父子、子孙、关系,但是实际上协程之间并不存在这么多的层级关系,在 Go 语言里只有一个主协程,其它都是它的子协程,子协程之间是平行关系。

值得注意的是这里的 go 关键字语法和前面的 defer 关键字语法是一样的,它后面跟了一个匿名函数,然后还要带上一对(),表示对匿名函数的调用。

上面的代码中主协程睡眠了 1s,等待子协程们执行完毕。如果将睡眠的这行代码去掉,将会看不到子协程运行的痕迹

  1. -------------
  2. run in main goroutine
  3. main goroutine will quit

这是因为主协程运行结束,其它协程就会立即消亡,不管它们是否已经开始运行。

子协程异常退出

在使用子协程时一定要特别注意保护好每个子协程,确保它们正常安全的运行。因为子协程的异常退出会将异常传播到主协程,直接会导致主协程也跟着挂掉,然后整个程序就崩溃了。

  1. package main
  2. import "fmt"
  3. import "time"
  4. func main() {
  5. fmt.Println("run in main goroutine")
  6. go func() {
  7. fmt.Println("run in child goroutine")
  8. go func() {
  9. fmt.Println("run in grand child goroutine")
  10. go func() {
  11. fmt.Println("run in grand grand child goroutine")
  12. panic("wtf")
  13. }()
  14. }()
  15. }()
  16. time.Sleep(time.Second)
  17. fmt.Println("main goroutine will quit")
  18. }
  19. ---------
  20. run in main goroutine
  21. run in child goroutine
  22. run in grand child goroutine
  23. run in grand grand child goroutine
  24. panic: wtf
  25. goroutine 34 [running]:
  26. main.main.func1.1.1()
  27. /Users/qianwp/go/src/github.com/pyloque/practice/main.go:14 +0x79
  28. created by main.main.func1.1
  29. /Users/qianwp/go/src/github.com/pyloque/practice/main.go:12 +0x75
  30. exit status 2

我们看到主协程最后一句打印语句没能运行就挂掉了,主协程在异常退出时会打印堆栈信息。从堆栈信息中可以了解到是哪行代码引发了程序崩溃。

为了保护子协程的安全,通常我们会在协程的入口函数开头增加 recover() 语句来恢复协程内部发生的异常,阻断它传播到主协程导致程序崩溃。recover 语句必须写在 defer 语句里面。

  1. go func() {
  2. defer func() {
  3. if err := recover(); err != nil {
  4. // log error
  5. }
  6. }()
  7. // do something
  8. }()

启动百万协程

Go 语言能同时管理上百万的协程,这不是吹牛,下面我们就来编写代码跑一跑这百万协程,读者们请想象一下这百万大军同时奔跑的感觉。

  1. package main
  2. import "fmt"
  3. import "time"
  4. func main() {
  5. fmt.Println("run in main goroutine")
  6. i := 1
  7. for {
  8. go func() {
  9. for {
  10. time.Sleep(time.Second)
  11. }
  12. }()
  13. if i % 10000 == 0 {
  14. fmt.Printf("%d goroutine started\n", i)
  15. }
  16. i++
  17. }
  18. }

上面的代码将会无休止地创建协程,每个协程都在睡眠,为了确保它们都是活的,协程会 1s 钟醒过来一次。在我的个人电脑上,这个程序创建了千万个协程还没有到上限,观察内存发现占用还不到 1G,这意味着每个协程的内存占用还不到 100 字节。

协程死循环

前面我们通过 recover() 函数可以防止个别协程的崩溃波及整体进程。但是如果有个别协程死循环了会导致其它协程饥饿得到不运行么?下面我们来做一个实验

  1. package main
  2. import "fmt"
  3. import "time"
  4. func main() {
  5. fmt.Println("run in main goroutine")
  6. n := 3
  7. for i:=0; i<n; i++ {
  8. go func() {
  9. fmt.Println("dead loop goroutine start")
  10. for {} // 死循环
  11. }()
  12. }
  13. for {
  14. time.Sleep(time.Second)
  15. fmt.Println("main goroutine running")
  16. }
  17. }

通过调整上面代码中的变量 n 的值可以发现一个有趣的现象,当 n 值大于 3 时,主协程将没有机会得到运行,而如果 n 值为 3、2、1,主协程依然可以每秒输出一次。要解释这个现象就必须深入了解协程的运行原理

协程的本质

一个进程内部可以运行多个线程,而每个线程又可以运行很多协程。线程要负责对协程进行调度,保证每个协程都有机会得到执行。当一个协程睡眠时,它要将线程的运行权让给其它的协程来运行,而不能持续霸占这个线程。同一个线程内部最多只会有一个协程正在运行。

第 11 课 —— 千军万马跑协程 - 图2

线程的调度是由操作系统负责的,调度算法运行在内核态,而协程的调用是由 Go 语言的运行时负责的,调度算法运行在用户态。

协程可以简化为三个状态,运行态、就绪态和休眠态。同一个线程中最多只会存在一个处于运行态的协程,就绪态的协程是指那些具备了运行能力但是还没有得到运行机会的协程,它们随时会被调度到运行态,休眠态的协程还不具备运行能力,它们是在等待某些条件的发生,比如 IO 操作的完成、睡眠时间的结束等。

第 11 课 —— 千军万马跑协程 - 图3

操作系统对线程的调度是抢占式的,也就是说单个线程的死循环不会影响其它线程的执行,每个线程的连续运行受到时间片的限制。

Go 语言运行时对协程的调度并不是抢占式的。如果单个协程通过死循环霸占了线程的执行权,那这个线程就没有机会去运行其它协程了,你可以说这个线程假死了。不过一个进程内部往往有多个线程,假死了一个线程没事,全部假死了才会导致整个进程卡死。

每个线程都会包含多个就绪态的协程形成了一个就绪队列,如果这个线程因为某个别协程死循环导致假死,那这个队列上所有的就绪态协程是不是就没有机会得到运行了呢?Go 语言运行时调度器采用了 work-stealing 算法,当某个线程空闲时,也就是该线程上所有的协程都在休眠(或者一个协程都没有),它就会去其它线程的就绪队列上去偷一些协程来运行。也就是说这些线程会主动找活干,在正常情况下,运行时会尽量平均分配工作任务。

设置线程数

默认情况下,Go 运行时会将线程数会被设置为机器 CPU 逻辑核心数。同时它内置的 runtime 包提供了 GOMAXPROCS(n int) 函数允许我们动态调整线程数,注意这个函数名字是全大写,Go 语言的设计者就是这么任性,该函数会返回修改前的线程数,如果参数 n <=0 ,就不会产生修改效果,等价于读操作。

  1. package main
  2. import "fmt"
  3. import "runtime"
  4. func main() {
  5. // 读取默认的线程数
  6. fmt.Println(runtime.GOMAXPROCS(0))
  7. // 设置线程数为 10
  8. runtime.GOMAXPROCS(10)
  9. // 读取当前的线程数
  10. fmt.Println(runtime.GOMAXPROCS(0))
  11. }
  12. --------
  13. 4
  14. 10

获取当前的协程数量可以使用 runtime 包提供的 NumGoroutine() 方法

  1. package main
  2. import "fmt"
  3. import "time"
  4. import "runtime"
  5. func main() {
  6. fmt.Println(runtime.NumGoroutine())
  7. for i:=0;i<10;i++ {
  8. go func(){
  9. for {
  10. time.Sleep(time.Second)
  11. }
  12. }()
  13. }
  14. fmt.Println(runtime.NumGoroutine())
  15. }
  16. ------
  17. 1
  18. 11

协程的应用

在日常互联网应用中,Go 语言的协程主要应用在HTTP API 应用、消息推送系统、聊天系统等。

在 HTTP API 应用中,每一个 HTTP 请求,服务器都会单独开辟一个协程来处理。在这个请求处理过程中,要进行很多 IO 调用,比如访问数据库、访问缓存、调用外部系统等,协程会休眠,IO 处理完成后协程又会再次被调度运行。待请求的响应回复完毕后,链接断开,这个协程的寿命也就到此结束。

在消息推送系统中,客户端的链接寿命很长,大部分时间这个链接都是空闲状态,客户端会每隔几十秒周期性使用心跳来告知服务器你不要断开我。在服务器端,每一个来自客户端链接的维持都需要单独一个协程。因为消息推送系统维持的链接普遍很闲,单台服务器往往可以轻松撑起百万链接,这些维持链接的协程只有在推送消息或者心跳消息到来时才会变成就绪态被调度运行。

聊天系统也是长链接系统,它内部来往的消息要比消息推送系统频繁很多,限于 CPU 和 网卡的压力,它能撑住的连接数要比推送系统少很多。不过原理是类似的,都是一个链接由一个协程长期维持,连接断开协程也就消亡。

在后面的高级内容部分,我将会教读者使用协程来实现上面这三个系统。下一章节我们开讲通道,因为通道的使用比较复杂,知识点较多,所以需要单独一节来讲。

第 11 课 —— 千军万马跑协程 - 图4

阅读更多精品文章,微信扫一扫上面的二维码关注公众号「码洞」