C++多线程系统编程
线程安全的对象生命期管理
编写线程安全的类不是难事,使用同步原语保护内部状态即可。但是对象的生与死不能由对象自身拥有的 mutex 来保护。如何避免对象析构时可能存在的 race condition 是 C++ 多线程编程面临的基本难题。
应了解 互斥器、竞争条件、智能指针、Observer设计模式。
1. 当析构函数遇到多线程
C++要求程序员自己管理对象的生命期,这在多线程环境下显得尤为困难。当一个对象能被多个线程同时看到时,那么对象的销毁时机就会变得模糊不清,可能出出现多种race condition:
- 在即将析构一个对象时,从何知道此刻是否有别的线程正在执行该对象的成员函数?
- 如何保证在执行成员函数期间,对象不会在另一个线程被析构?
- 在调用某个对象的成员函数之前,如何得知这个对象还活着?它的析构函数会不会碰巧执行到一半?
1.1 线程安全的定义
一个线程安全的class应当满足以下三个条件:
- 多个线程同时访问时,其表现出正确的行为;
- 无论操作系统如何调用这些线程,无论这些线程的执行顺序如何交织;
- 调用端代码无须额外的同步或其他协调动作。
根据这个定义,C++标准库的大多数class都不是线程安全的,包括 std::string、std::vector、std::map 等,因为这些class通常需要在外部加锁才能供多个线程同时访问。
1.2 MutexLock 与 MutexLockGuard
https://blog.csdn.net/KangRoger/article/details/47067801
2. 对象的创建很简单
对象构造要做到线程安全,唯一的要求就是在构造期间不要泄露this指针:
- 不要在构造函数中注册任何回调函数;
- 也不要在构造函数中把this传给跨线程的对象;
- 即便在构造函数的最后一行也不行。
是因为在构造函数执行期间对象还没有完成初始化,如果this指针被泄露给了其他对象,那么别的线程有可能访问这个半成品对象,会造成难以预料的后果。
//不要这么做
class Foo : public Observer
{
public:
Foo(Observable* s)
{
s->register_(this); //错误,非线程安全
}
virtual void update();
}
//要这么做
class Foo : public Observer
{
public:
Foo();
virtual void update();
//另外定义一个函数,在构造之后执行回调函数的注册工作
void obeserve(Observable* s)
{
s->register_(this);
}
};
Foo* pFoo = new Foo;
Observable* s = getSubject();
pFoo->observe(s); //二段式的构造
相对来说,对象的构造做到线程安全还是比较容易的。
3. 销毁太难
作为class数据成员的MutexLock只能用于同步本class的其他数据成员的读和写,它不能保护安全的析构。因为MutexLock成员的生命期最多与对象一样长,而析构动作可以说是发生在对象身故之后(或者身亡之时)。
另外,对于基类对象,那么调用到基类析构函数的时候,派生类对象的那部分已经析构,那么基类所拥有的MutexLock不能保护整个析构过程。
再说,析构过程本来也不需要保护,因为只有别的线程都访问不到这个对象时,析构才是安全的,否则会发生竞态条件。
另外如果要同时读写一个class的两个对象,有潜在的死锁可能。如果一个函数要锁住相同类型的对个对象,为了保证始终按相同的顺序加锁,我们可以比较mutex对象的地址,始终线加锁地址较小的mutex。
4. 线程安全的Observeer有多难
一个动态创建的对象的是否还活着,光看指针时看不出来的。指针就是指向一块内存,这款内存的对象如果已经销毁,那么就根本不能访问,所以根据这个去判断是没有意义的。
在面向对象程序设计中,对象的关系主要有三种:composition(组合)、aggregation(聚合)、association(关联)。后两种关系,它表示一个对象a用到了另一个对象b,调用了后者的成员函数,从代码形式上看,a持有b的指针,但是b的生命周期不由a单独控制,如果b是动态创建的,并在整个程序结束前有可能被释放,那么就会出现竞态条件。
那么似乎可以只创建不销毁,程序使用一个对象池来暂存用过的对象,下次申请对象时,如果对象池里面有存货,久重复利用,否则就新建一个。对象用完了,不是直接释放,而是放回池子里。但是这种方法也有缺点:
- 对象池的线程安全,如何安全地、完整地把对象放回池子里,防止出现“部分放回”的竞态?(A线程认为对象x已经放回了,B认为对象x还活着。)
- 全局共享数据引发的lock contention,这个集中化的对象池会不会把多线程并发的操作串行化?
- 会不会造成内存泄露与分片?因为对象池占用的内存只增不减,而且对象池不能共享内存。
5. 原始指针有何不妥
指向对象的原始指针是坏的,尤其当暴露给别的线程时。Observable应当保存的不是原始的Observer*,而是别的什么东西,能分辨Observer对象是否还活着。
6. 神器 shared_ptr/weak_ptr
shared_ptr 是引用计数型智能指针,当引用计数降为0时,对象被销毁。weak_ptr 也是一个引用计数型智能指针,但是它不增加对象的引用次数,即弱引用。
7. 系统的避免各种指针错误
C++里可能出现的内存问题大致有几个方面:
- 缓冲区溢出
- 空悬指针、野指针
- 重复释放
- 内存泄露
- 不配对的new和delete
- 内存碎片
正确使用智能指针可以很轻易地解决前面5个问题,第6个问题需要别的思路。
- 缓冲区溢出:用std::vector<char>/std::string来管理缓冲区,自动记录缓冲区的长度,并通过成员函数而不是裸指针来修改缓冲区。
- 空悬指针、野指针:使用shared_ptr活着weak_ptr
- 重复释放:使用scoped_ptr,只在对象析构的时候释放一次。
- 内存泄露:用scoped_ptr,对象析构的时候自动释放内存。
- 不配对的new和delete:把new替换成std::vector/scoped_array。