并发编程

Python的并发编程(六)- 多进程

2019-05-13  本文已影响0人  SavingUnhappy

之前学习了多线程以及线程池,他们在执行I/O密集的程序的时候,性能是很高的,但是如果我们有大量的CPU密集型工作的程序,现在想利用多个CPU的优势运行的更快,应该怎么解决呢?

这时候,就不能使用多线程了,而是需要真正的并行来解决问题。

concurrent.futures库中提供了一个ProcessPoolExecutor类,可用来在单独运行的python解释器实例中执行计算密集的函数。

ProcessPoolExecutor的典型用法是下面这样的:

from concurrent.futures import ProcessPoolExecutor

with ProcessPoolExecutor() as pool:
    """
    在进程池pool中并行执行任务
    """

在底层,ProcessPoolExecutor创建了N个独立运行的Python解释器,这里的N就是系统上检测到的可用的CPU个数。可以创建和修改Python的进程数,只要给ProcessPoolExecutor(N)提供一个可选的参数。进程池会一直运行,直到with语句块中的最后一条语句执行完毕为止,此时进程池就会关闭。但是程序会一直等待所有已经提交的任务都处理完毕为止。

提交到进程池中的任务必须定义为函数形式。有两种方法可以提交任务。如果想并行处理一个列表推导式或者map()操作,可以使用pool.map()

from concurrent.futures import ProcessPoolExecutor

def work(x):
    """任务逻辑"""
    return x

data = [1, 2, 3, 4]

with ProcessPoolExecutor() as pool:
    """
    在进程池pool中并行执行任务
    """
    results = pool.map(work, data)

另一种方式是通过pool.submit()来手动提交单独的任务:

from concurrent.futures import ProcessPoolExecutor

def work(x):
    """任务逻辑"""
    return x

data = 1

with ProcessPoolExecutor() as pool:
    """
    在进程池pool中并行执行任务
    """
    future_result = pool.submit(work, data)
    result = future_result.result()

如果手动提交任务,得到的结果就是一个Future实例。要获取到结果还需要手动调用result()方法。这么做会阻塞进程,直到结果返回为止。所以与其让进程阻塞,不如提供一个回调函数,让他执行任务完成时出发执行。示例如下:

from concurrent.futures import ProcessPoolExecutor

def work(x):
    """任务逻辑"""
    return x

def when_done(r):
    print("result:", r.result())

data = 1

with ProcessPoolExecutor() as pool:
    """
    在进程池pool中并行执行任务
    """
    future_result = pool.submit(work, data)
    future_result.add_done_callback(when_done)

用户提供的回调函数需要接受一个Future实例,必须用他才能获取实际的结果。

尽管进程池看起来很简单,但是在设计规模更大的程序时有下面几个重要的因素需要考虑。

本文最先发布于:SavingUnhappy

上一篇 下一篇

猜你喜欢

热点阅读