2019-01-17多线程
一,进程和线程
1.什么是进程
进程是指在系统中正在运行的一个应用程序
每个进程之间是独立的,每个进程均运行在其专用且受保护的内存空间内
2.什么是线程
一个进程想要执行任务,必须有线程(每个进程至少要有1条线程)
一个进程(程序)的所有任务都在线程中执行
3.什么是多线程
1个进程中可以开启多条线程,每条线程可以并行执行不同的任务
多线程技术可以提高程序的执行效率
4.多线程的原理
同一个时间,CPU只能处理一条线程,只有1条线程在执行
多线程并发执行,其实是cpu快速的在多条线程之间调度
如果CPU调度线程的事件足够快,就造成了多线程并发执行的假象
5.耗时操作
(1)耗时操作放到主线程中的问题
耗时操作放到主线程中会阻塞线程
多个耗时操作都放到一个线程中执行,最终执行时间是多个耗时操作时间和
(2)怎么解决
使用多线程(创建多个线程)
Python自带的内置模块 threading模块,可以支持多线程,所有的进程默认都有一个线程(一般叫这个线程为主线程),其他线程就叫子线程。如果想要在进程中添加其他的线程,就创建线程对象。
6.多线程技术
python内置的threading模块,可以支持多线程
所有的进程默认都有一个线程(一般叫这个线程为主线程),其他的线程叫子线
如果想要在进程中添加其他的线程,就创建线程对象
7.多线程类似于同时执行多个不同程序,多线程运行有如下优点:
使用线程可以把占据长时间的程序中的任务放到后台去处理。
用户界面可以更加吸引人,这样比如用户点击了一个按钮去触发某些事件的处理,可以弹出一个进度条来显示处理的进度
程序的运行速度可能加快
在一些等待的任务实现上如用户输入、文件读写和网络收发数据等,线程就比较有用了。在这种情况下我们可以释放一些珍贵的资源如内存占用等等。
8.线程可以分为:
内核线程:由操作系统内核创建和撤销。
用户线程:不需要内核支持而在用户程序中实现的线程。
线程在执行过程中与进程还是有区别的。每个独立的线程有一个程序运行的入口、顺序执行序列和程序的出口。但是线程不能够独立执行,必须依存在应用程序中,由应用程序提供多个线程执行控制。
每个线程都有他自己的一组CPU寄存器,称为线程的上下文,该上下文反映了线程上次运行该线程的CPU寄存器的状态。
指令指针和堆栈指针寄存器是线程上下文中两个最重要的寄存器,线程总是在进程得到上下文中运行的,这些地址都用于标志拥有线程的进程地址空间中的内存。
线程可以被抢占(中断)。
在其他线程正在运行时,线程可以暂时搁置(也称为睡眠) -- 这就是线程的退让。
import time
from datetime import datetime
# python多线程技术对应的模块
import threading
"""
默认情况下,一个进程有且只有一个线程,这个线程叫主线程
threading模块中的Thread类就是线程类, 这个类的对象就是线程对象, 一个线程对象对应一个子线程。
(需要一个子线程就创建一个Thread类的对象)
"""
def download(file):
print('%s开始下载' % file, datetime.now())
# sleep(时间) - 程序执行到这个位置等待指定的时候再接着往后面执行
time.sleep(10) # 有这步等10秒后才是枪王之王.mp4下载结束, 然后再是开国大典开始下载,再等10秒后开国大典下载结束
print('%s下载结束' % file, datetime.now())
def main():
print('程序开始')
# print(datetime.now())
# 1.在主线程中下载三个电影(总耗时30s)
# download('枪王之王.mp4')
# download('开国大典')
# download('黄金国')
# 2.在三个线程中同时下载三个电影
"""
Thread(target, args) - 创建子线程对象
说明:
target - Function(函数), 需要传一个函数(这个函数中的内容会在子线程中执行)
args - 元祖,target对应的函数的参数
当通过创建好的子线程对象调用start方法的时候, 会自动在子线程中调用target对应的函数,并且将args中的值作为实参
"""
t1 = threading.Thread(target=download, args=('枪王之王.mp4',)) # args的值是元祖
t2 = threading.Thread(target=download, args=('开国大典',))
t3 = threading.Thread(target=download, args=('黄金国',))
# 开始执行t1对应的子线程中的任务(实质就是在子线程中调用target对应的函数)
t1.start()
t2.start()
t3.start() # 3个同时下载, 同时结束
if __name__ == '__main__':
main()
二,Thread子类
import threading
import time as time1
from datetime import time
"""
可以通过写一个类继承Thread类, 来创建属于自己的线程类
1.声明类继承
2.实现(重写)run方法 - 这个方法中的任务就是需要在子线程中执行的任务
3.需要线程对象的时候,创建当前声明的类的对象;然后通过start方法在子线程中去执行run方法中的任务
"""
class DownloadThread(threading.Thread):
"""下载类"""
def __init__(self, file):
super().__init__()
self.file = file
def run(self):
print('开始下载:' + self.file)
print('run', threading.current_thread())
time1.sleep(10)
print('%s下载完成' % self.file)
print('run方法中的代码')
def main():
# 获取当前线程
print(threading.current_thread())
t1 = DownloadThread('沉默的羔羊.mp4')
t2 = DownloadThread('恐怖游轮.mp4')
# 调用start的时候会自动在子线程中调用run方法
t1.start() # run <DownloadThread(Thread-1, started 5856)> Thread-1(子线程-1)
t2.start() # run <DownloadThread(Thread-2, started 5360)> Thread-2(子线程-2)
# 注意: 如果直接用对象调用run方法, run方法中任务会在主线程执行
# t1.run() # run <_MainThread(MainThread, started 5496)> MainThread这是主线程了
if __name__ == '__main__':
main()
三,join
from threading import Thread
import requests
import re
class DownloadImageThread(Thread):
def __init__(self, url):
super().__init__()
self.url = url
def run(self):
# 开始下载
response = requests.get(self.url)
content = response.content
file_name = re.split(r'/', self.url)[-1]
print(file_name)
with open('images/'+file_name, 'bw') as f:
f.write(content)
def main():
t1 = DownloadImageThread('https://image.haha.mx/2015/12/04/middle/2082175_c5c3cc05eb73e4023149e663475d3ab4_1449192201.gif')
t1.start()
# 线程对象调用join方法, 会导致join后的代码会在线程中的任务结束后才执行
t1.join()
print('下载结束!')
if __name__ == '__main__':
main()
老师的代码
"""__author__ = 余婷"""
from threading import Thread
import requests
import re
import time
from random import randint
class DownloadThread2(Thread):
"""下载类"""
def __init__(self, file, time):
super().__init__()
self.file = file
self.time = time
def run(self):
print('开始下载:'+self.file)
# t = randint(5, 10)
time.sleep(self.time)
print('%s下载结束, 总共耗时:%ds' % (self.file, self.time))
class DownloadImageThread(Thread):
def __init__(self, url):
super().__init__()
self.url = url
def run(self):
# 开始下载
file_name = re.split(r'/', self.url)[-1]
print(file_name)
print('%s开始下载' % file_name)
response = requests.get(self.url)
content = response.content
with open('images/'+file_name, 'bw') as f:
f.write(content)
print('%s下载结束' % file_name)
def creat_thread():
t1 = DownloadThread2('电影1', 6)
t2 = DownloadThread2('电影2', 4)
t1.start()
t2.start()
# 线程对象调用join方法,会导致join后的代码会在线程中的任务结束后才执行
t1.join()
t2.join()
print('电影下载结束!')
def main():
# t1 = DownloadImageThread('https://image.haha.mx/2015/12/04/middle/2082175_c5c3cc05eb73e4023149e663475d3ab4_1449192201.gif')
# t1.start()
#
# t2 = DownloadImageThread('http://img4.imgtn.bdimg.com/it/u=534897622,845095650&fm=26&gp=0.jpg')
# t2.start()
t0 = Thread(target=creat_thread)
t0.start()
print('========')
for x in range(100):
time.sleep(1)
print(x)
if __name__ == '__main__':
main()