IO模型
描述
本文摘自UNIX网络编程卷1:套接字联网API,描述了UNIX中五种IO模型。阻塞IO、非阻塞IO、IO复用、信号驱动IO、异步IO。并定义了同步IO和异步IO。
全文
一个输入操作通常包含两个不同的阶段:
- 等待数据准备好;
- 从内核向进程复制数据。
对于一个套接字上的输入操作,第一步通常涉及等待数据从网络到达。当所等待分组到达时,它被复制到内核中的某个缓冲区。第二步就是把数据从内核缓冲区复制到应用进程缓冲区。
阻塞式IO模型
blocking io,默认情况下,所有套接字都是阻塞的。以数据报套接字作为例子。
阻塞式IO模型
进程调用recvfrom,其系统调用直到数据报到达且被复制到应用进程的缓冲区中或者发生错误才返回。最常见的错误是系统调用被信号中断。我们说进程在从调用recvfrom开始到它返回的整段时间内是被阻塞的。recvfrom成功返回后,应用进程开始处理函数。
非阻塞式IO模型
进程把一个套接字设置成非阻塞是在通知内核:当所请求的IO操作非得把本进程投入睡眠才能完成时,不要把本进程投入睡眠,而是返回一个错误。
非阻塞式IO模型前三次调用recvfrom时没有数据可返回,因此内核转而立即返回一个EWOULDBLOCK错误,第四次调用recvfrom时已有一个数据准备好,它被复制到应用进程缓冲区,于是recvfrom成功返回。我们接着处理数据。
当一个应用进程像这样对一个非阻塞描述符循环调用recvfrom时,我们称之为轮询(polling)。应用进程持续轮询内核,以查看某个操作是否就绪。这么做往往耗费大量CPU时间。
IO复用模型
IO multiplexing,我们就可以调用select或poll,阻塞在这个两个系统调用中的某一个之上。
IO复用模型我们阻塞于select调用,等待数据报套接字变为可读。当select返回套接字可读这一条件时,我们调用recvfrom把所有数据报复制到应用进程缓冲区。
IO复用和阻塞式IO相比,并不显得有什么优势,事实上由于使用select需要两个而不是单个系统调用,IO复用还稍有劣势。不过select的优势在于可以等待多个描述符就绪。
与IO复用密切相关的另一种IO模型是在多线程中使用阻塞式IO。这种模型与IO复用极为相似,但它没有使用select阻塞在多个文件描述符上,而是使用多个线程(每个文件描述符一个线程),这样每个线程都可以自由地调用诸如recvfrom之类的阻塞式IO系统调用了。
信号驱动式IO模型
用信号让内核在描述符就绪时发送SIGIO信号通知我们。
信号驱动式IO模型首先开启套接字的信号驱动式IO功能,并通过sigaction系统调用安装一个信号处理函数。该系统调用将立即返回,我们的进程继续工作,也就是说它没有被阻塞。当数据报准备好读取时,内核就为该进程产生一个SIGIO信号。我们随后既可以在信号处理函数中调用recvfrom读取数据报,并通知主循环数据已准备好待处理,也可以立即通知主循环,让它读取数据报。
无论如何处理SIGIO信号,这种模型的优势在于等待数据报到达期间进程不被阻塞。主循环可以继续执行,只要等待来自信号处理函数的通知:既可以是数据已准备好被处理,也可以是数据报已准备好被读取。
异步IO模型
asynchronous io。工作机制:告知内核启动某个操作,并让内核在整个操作操作(包括将数据从内核复制到我们自己的缓冲区)完成后通知我们。这种模型与前一节介绍的信号驱动模型的主要区别在于:信号驱动式IO是由内核通知我们何时可以启动一个IO操作,而异步IO模型是由内核通知我们IO操作何时完成。
异步IO模型我们调用aio_read函数(POSIX异步IO函数以aio_或lio_开头),给内核传递描述符、缓冲区指针、缓冲区大小(与read相同的三个参数)和文件偏移(与lseek类似),并告诉内核当整个操作完成时如何告诉我们。该系统调用立即返回,而且在等待IO完成期间,我们的进程不被阻塞。本例子中我们假设要求内核在操作完成时产生某个信号。该信号直到数据已复制到应用进程缓冲区才产生,这一点不同于信号驱动式IO模型。
各种IO模型的比较
前4种模型的主要区别在于第一阶段,因为它们的第二阶段是一样的:在数据从内核复制到调用者的缓冲区期间,进程阻塞于recvfrom调用。相反,异步IO模型在这两个阶段都要处理,从而不同于其他4种模型。
各种IO模型比较同步IO和异步IO对比
POSIX把这两个术语定义如下:
- 同步IO操作(synchronous IO operation)导致请求进程阻塞,直到IO操作完成;
- 异步IO操作(asynchronous IO operation)不导致请求进程阻塞。
根据上述定义,我们的前4种模型——阻塞式IO模型、非阻塞式IO模型、IO复用模型和信号驱动式IO模型都是同步IO模型,因为其中真正的IO操作(recvfrom)将阻塞进程。只有异步IO模型与POSIX定义的异步IO相匹配。