python学习笔记之--多线程编程
简介
现代计算机基本上都是多CPU架构,为了更好的利用CPU资源,都绕不开并发执行理论支持。当前的操作系统基本上都是运行多进程,进程中又会启动多个线程。进程之间相互隔离,同进程的线程之间有单独的栈空间,大部分共享进程的资源。操作系统以线程作为调度的最小单元,最大化的实现了并发执行。
本文就学习一下python语言中多线程编程相关的内容。
python多线程特点
-
全局解释器锁
python代码的执行由python虚拟机来控制。python在设计之初考虑到要在主循环中同时只有一个线程在执行(就像单CPU),引入了全局解释器锁来保证。所以python语言中的多线程并不能真正的并发执行(只能通过多进程来实现,不在这里讲述)。
但是python的多线程也并不是毫无用处,在I/O密集型的应用场景可以使用多线程模型 -
守护线程
python实现中,当主线程退出时,所有的子线程(不论它们是否还在工作)都会被强行退出,并且没有任何警告。这就引入了守护线程。
守护线程一般是一个等待客户请求的服务器,如果没有客户请求,就一直等待。当一个线程设置成为守护线程表示这个线程不重要。主线程退出时不用等待此线程的退出。
多线程编程方法
在python语言中通过threading
模块来支持多线程编程。常用的方法有三种
- 创建一个
threading.Thread类的实例
,传入一个函数import threading def func(str): print(f'Hello {str}: {threading.get_native_id()}') def main(): print(f"main thread: {threading.get_native_id()}") t = threading.Thread(target=func, args=('alex',)) t.start() if __name__ == '__main__': main()
- 创建一个
threading.Thread类的实例
,传入一个可调用的类对象import threading class MyThreadFunc: def __init__(self, func, args): self.func = func self.args = args def __call__(self): self.func(self.args) def f(str): print(f'Hello {str}: {threading.get_native_id()}') def main(): print(f"main thread: {threading.get_native_id()}") t = threading.Thread(target=MyThreadFunc(f, ('alex',))) t.start() if __name__ == '__main__': main()
- 从
threading.Thread类
派生一个子类,并实现run
接口实现线程的运行逻辑import threading class MyThread(threading.Thread): def __init__(self, func, args): threading.Thread.__init__(self) self.func = func self.args = args def run(self): self.func(self.args) def func(str): print(f'Hello {str}: {threading.get_native_id()}') def main(): print(f"main thread: {threading.get_native_id()}") t = MyThread(func, ('alex',)) t.start() if __name__ == '__main__': main()
其实前两种可以合并为一种,函数也是一种可调用对象。另外最常用的是第三种方式
Thread类
threading模块的Thread类原型如下:
class threading.Thread(group=None, target=None, name=None, args=(), kwargs={}, *, daemon=None)
常用的方法如下
方法 | 说明 |
---|---|
start() |
开始线程的执行,它在一个线程里最多只能被调用一次 |
run() |
线程逻辑实现接口,一般被子类重写 |
join(timeout=None) |
将调用此接口的线程挂起,并等待此线程结束 |
setDeamon() |
设置线程为守护线程,后面会直接以特征属性方式使用 |
同步
并发执行肯定会遇到多个线程操作同一个资源,这就需要同步机制来保证资源被正确的操作。
在threading模块中提供了多种同步机制
- 锁Lock
- 可重入锁RLock
- 条件变量Condition
- 事件Event
- 信号量Semaphone、BoundedSemaphone
- 定时器Timer
- 栅栏对象
详细说明,可以参考官方文档
线程间通讯--queue模块
python给线程间通讯提供了一个专门的模块queue
,此模块提供一个线程安全的队列(与数据结构中的队列不一样)。
queue模块接口内部已经使用了同步机制,所以可以在多线程场景下安全的操作,而无需考虑同步问题。此模块特别适合生产者--消费者
问题
详细说明参考官方文档