python的那些坑

python 多线程,线程池的使用。

2019-04-10  本文已影响0人  Ziger丶

背景:近期工作需要,要缩短多个程序的运行时间。
目标:做到同时运行多个函数,提高效率。
方案:查阅资料后,发现可以使用线程,进程,协程来提高效率。(包括线程池,进程池)


【一】 多线程

参考原文


【二】 线程池

tips:
#需要处理列表中的所有数据
url_list =[url1,ulr2,-----,url100]

工作中需要对一个列表中的所有数据进行处理,直接用多线程的话,一开始数据数对不上,后来拆分成多个列表进行处理的话,感觉很麻烦。所以开始使用线程池。
参考原文

1、下载运行包
pip install threadpool 
2、参数说明
pool = ThreadPool(poolsize)

定义了一个线程池,表示最多可以创建poolsize这么多线程;

requests = makeRequests(some_callable, list_of_args, callback)

调用makeRequests创建了要开启多线程的函数,以及函数相关参数和回调函数,其中回调函数可以不写,default是无,也就是说makeRequests只需要2个参数就可以运行;

for req in requests:  
    pool.putRequest(req) 

是将所有要运行多线程的请求扔进线程池;

pool.wait() 

第四行是等待所有的线程完成工作后退出

3、对比效果
#创建一个长度30的列表
a = []
n =1 
while n<=30:
    a.append(n)
    n +=1

#创建一个存储位置
c = []

#定义一个对单一数据处理的函数,将处理后的数据存储在c中
def x(aaa):
    u = (12+aaa)+aaa%2
    c.append(u)
    print ("Hello ",aaa)    
    time.sleep(1)

串行操作:

start_time = time.time()
for i in a:
    x(i)
print(c)
print ('%d second'% (time.time()-start_time))

串行结果


运行时间
结果

线程池操作:

start_time = time.time()
#一次跑10个线程
pool = threadpool.ThreadPool(10) 
#运行函数x,参数为a
requests = threadpool.makeRequests(x, a) 
[pool.putRequest(req) for req in requests] 
pool.wait() 
print ('%d second'% (time.time()-start_time))

线程池结果


运行时间
结果

运用线程池可以批量处理数据,节省时间

4、多个参数的设置。

实际工作中定义的函数不止包含一个参数,那么在调用线程池的时候需要对参数做预处理。

if __name__ == '__main__':
     
   # 方法1  --- 存入列表 
    lst_vars_1 = ['1', '2', '3']
    lst_vars_2 = ['4', '5', '6']
    func_var = [(lst_vars_1, None), (lst_vars_2, None)]
    
    # 方法2  --- 存成字典
    dict_vars_1 = {'m':'1', 'n':'2', 'o':'3'}
    dict_vars_2 = {'m':'4', 'n':'5', 'o':'6'}
    func_var = [(None, dict_vars_1), (None, dict_vars_2)]    
     
    pool = threadpool.ThreadPool(2)
    requests = threadpool.makeRequests(hello, func_var)
    [pool.putRequest(req) for req in requests]
    pool.wait()

参数处理:

list1 = [1,2,3,4,5,6]
list2 = [7,6,5,4,3,2]

def  X(a,b,c=3,d=4,e=5):
    time.sleep(1)
    print(a+b+c+d+e)

#构建参数组
data1 =[ {
        'a':i,
        'b':j,
        'c':3,
        'd':4
         } for i,j in zip(list1,list2) ]

data2 = [(None,i) for i in data1]

#调用线程池
start_time = time.time()
pool = threadpool.ThreadPool(2)
requests = threadpool.makeRequests(X, data2)
[pool.putRequest(req) for req in requests]
pool.wait()
print ('%d second'% (time.time()-start_time))
5、编写线程池函数。

实际工作中可以将线程池编写如函数直接进行调用。
参数包含(函数,运行所需的参数,线程数量)

def Run_threadpool (function,data,number):
    pool = threadpool.ThreadPool(number)
    requests = threadpool.makeRequests(function, data)
    [pool.putRequest(req) for req in requests]
    pool.wait()  
6、异常can’t start new thread

我在跑某个程序时,创建线程池到一个方法中,这个方法会被循环调用,即使局部变量pool被覆盖,但是之前创建的线程依然存在,所以线程炸了

pool = threadpool.ThreadPool(10)
把上面的代码放进class的构造函数中,或者保证它只执行一次

python中线程的正确用法是,按需创建线程,重复使用有限的线程

上一篇下一篇

猜你喜欢

热点阅读