IOS闲时技术iOS FoundationsiOS 多线程

理解GCD死锁

2016-05-21  本文已影响1757人  写Blog不取名

因为本文只做分享用,非学术性文章,所以某些理论并不是非常严谨,望大家见谅。写下这篇文章有以下的目:

1. 巩固自己的知识,只有把自己知道的东西系统地组织出来,才知道自己到底知不知道。
2. 分享心得,希望刚入门开发的朋友,能够知其然且知其所以然,而不是仅仅死记硬背哪些情况会造成死锁。
3. 希望看到我博客的朋友,能够为我指出我理解中的不足与错误之处,共同进步。

一、搞清线程(Thread)和队列(Queue)的区别

网上一些讲解关于GCD死锁的文章,有一些非常明显的错误,比如:认为死锁的原因是线程阻塞造成的,这是非常大的误解,GCD死锁的原因是队列阻塞,而不是线程阻塞

Thread与Queue的关系
在开发中,我们会把block(也就是swift中的closure),也就是我们想做的任务,交给GCD函数。GCD函数会把任务放进我们指定的队列(Queue),当然GCD函数内部不止是把任务放进队列,还包括一些其他不为我们所知的操作。队列遵循严格的先进先出原则,同一个Queue中,最早入列的block,会最早被分配给线程执行。系统(“系统”指所有被苹果黑盒封装,未公开源码,我们不能得知的操作,下同)会依据顺序从队列中取出block,并且交由线程执行。GCD队列只是组织待执行任务的一个数据结构封装,而线程,才是执行任务的人。

二、回顾程序执行顺序

要往下面讲,不得不回顾一个再基础不过的知识点,我想,这是每一个程序员,入门就知道的超级简单的知识。虽然它非常基础,但是,这正是造成我们GCD死锁的重要因素。很多困难的问题,它们背后隐藏的东西往往非常简单,因为事物永远不会脱离本质。

让我们来看看下面的这个C程序:

#include <stdio.h>

void printFiveNumbers(){
    printf("开始执行printFiveNumbers函数了\n");
    for (int i = 0; i < 5; i++) {
        printf("printFiveNumbers - %d\n",i);
    }
    printf("执行完printFiveNumbers函数了\n");
}

//main函数是程序的入口
int main(){
    printf("main函数开始执行了\n");
    printFiveNumbers();
    printf("main函数执行完了\n");
    return 0;
}
运行结果
大家都知道,运行的结果是怎么样了,程序的入口是main函数,于是Run这个程序后,马上就会进入main函数执行,执行了第一句打印后,会跳入printFiveNumbers这个函数执行,直到printFiveNumbers执行完,才会返回到main函数继续执行下一句。重点是:外层方法会等待内层方法返回后,再执行下一句指令。就好像把printFiveNumbers函数的所有语句,都复制粘贴到了main方法里一样。

三、GCD死锁的本质

让我们看看下面这个程序:

    override func viewDidLoad() {
        super.viewDidLoad()
        print("Start \(NSThread.currentThread())")
        //GCD同步函数
        dispatch_sync(dispatch_get_main_queue(), {
            for i in 0...100{
                print("\(i) \(NSThread.currentThread())")
            }
        })
        print("End \(NSThread.currentThread())")
    }
运行结果(已造成GCD死锁)
这个程序就是典型的死锁,可以看到,只打印了“Start”一行,就再也没有响应了,已经造成了GCD死锁。为什么会这样呢?让我们来解读一下这段程序的运行顺序:首先会打印“Start”,然后将主队列和一个block传入GCD同步函数dispatch_sync中,等待sync函数执行,直到它返回,才会执行打印“End”的语句。可是,竟然没有反应了?block中的101个数字没有被打印出来任何一个,viewDidLoad()中的End也没有被打印出来。也就是说,block没有得到执行的机会,viewDidLoad也没有继续执行下去。为什么block不执行呢?因为viewDidLoad也是执行在主队列的,它是正在被执行的任务,也就是说,viewDidLoad()是主队列的队头。主队列是串行队列,任务不能并发执行,同时只能有一个任务在执行,也就是队头的任务才能被出列执行。我们现在被执行的任务是viewDidLoad(),然后我们又将block入列到同一个队列,它比viewDidLoad()后入列,遵循先进先出的原理,它必须等到viewDidLoad()执行完,才能被执行。但是,dispatch_sync函数的特性是,等待block被执行完毕,才会返回,因此,只要block一天不被执行,它就一天不返回。我们知道,内部方法不返回,外部方法是不会执行下一行命令的。不等到sync函数返回,viewDidLoad打死也不会执行print End的语句,因此,viewDidLoad()一直没有执行完毕。block在等待着viewDidLoad()执行完毕,它才能上,sync函数在等待着block执行完毕,它才能返回,viewDidLoad()在等待着sync函数返回,它才能执行完毕。这样的三方循环等待关系,就造成了死锁。
也许文字描述比较抽象,我们再来配一幅图:
串行队列阻塞的原因
可以这么理解:每一个队列,有自己的执行室,串行队列的执行室,只能容纳一个任务,并发队列的执行室,可以同时容纳若干个任务。队头的任务,只要执行室有空位,就会被放入执行室执行。viewDidLoad任务在执行中,我们的主队列又是串行队列,执行室只能容纳一个任务,那么队头的block就需要等待viewDidLoad执行完毕才能进入执行室,那么就造成了,viewDidLoad永远不会执行完毕,block永远不能执行。
三方等待 2016-05-25 上午10.01.35.png
sync函数永远不能返回,最终,就是GCD死锁。

以上两点阻塞情景,同时只出现一个,并不会出现死锁,但是如果两个同时出现,就会出现阻塞闭环,造成死锁。因此,造成GCD死锁的原因就是同时具备这两个因素,只要大家理解了这点,就再也不用死记硬背哪些情况会造成GCD死锁了。

四、解决GCD死锁

我们已经有结论,造成GCD死锁,是由于同时具备以下两点因素:

1. GCD函数未返回,会阻塞正在执行的任务
2. 队列的执行室容量太小,在执行室有空位之前,会阻塞同一个队列中在等待的任务

死锁是由于阻塞闭环造成的,那么我们只用消除其中一个因素,就能打破这个闭环,避免死锁。
#######方法1:解决GCD函数未返回造成的阻塞
先提出两个知识点:

#######方法2:解决队列(Queue)阻塞
解决队列阻塞,有两种方法:

  1. 为队列的执行室扩容,让它可以并发执行多个任务,那么就不会因为A任务,造成B任务被阻塞了。
  2. 把A和B任务放在两个不同的队列中,A就再也没有机会阻塞B了。因为每个队列都有自己的执行室。
    首先来说第一个思路,如何为队列的执行室扩容呢?我们当然没有办法为执行室扩容,但是我们可以选择用容量大的队列。使用并发队列替代串行队列。因为并发队列的执行室可以同时容纳若干任务
    再来说第二个思路,我们来看代码:
override func viewDidLoad() {
        super.viewDidLoad()
        print("Start \(NSThread.currentThread())")
        let serialQueue = dispatch_queue_create("这是一个串行队列", DISPATCH_QUEUE_SERIAL)
        dispatch_sync(serialQueue, {
            for i in 0...100{
                print("\(i) \(NSThread.currentThread())")
            }
        })
        print("End \(NSThread.currentThread())")
}
运行结果(成功运行,并未死锁)

我们自己新建了一个串行队列,将block放入自己的串行队列,不再和viewDidLoad()处于一个队列,解决了队列阻塞,因此避免了死锁问题。
网上有一些帖子说“在主线程使用sync函数就会造成死锁”或者“在主线程使用sync函数,同时传入串行队列就会死锁”,都是非常错误的观念,希望大家能够真正理解GCD死锁的原理,而不是死记硬背。

上一篇下一篇

猜你喜欢

热点阅读