@IT·互联网

IO读写原理与IO模型

2022-04-30  本文已影响0人  隔壁王哥

概述

I/O,即输入/输出(Input/Output)。用户程序进行IO操作并不是直接操作硬件设备进行读写,而是通过调用操作系统提供的函数,真正的IO操作是由操作系统内核来完成的。在进行IO操作时CPU会从用户态切换为内核态,而操作结束后又需要从内核态切换为用户态,频繁的状态切换会使 CPU将大量时间耗费在寄存器、内核栈以及虚拟内存等资源的保存和恢复上,从而影响程序运行效率。此外,除了系统调用产生的CPU上下文切换,线程上下文切换也面临着该问题。

内核空间与用户空间

为了保护操作系统安全,操作系统按照特权等级将将虚拟空间划分为两个部分,内核空间与用户空间。内核空间(Ring 0)是操作系统内核访问的区域,具有最高权限,可以直接访问所有资源。用户空间(Ring 3)是普通应用程序可访问的内存区域,只能访问受限资源,不能直接访问内存等硬件设备,必须通过系统调用陷入到内核中,才能访问这些特权资源。只能访问用户空间也就是运行在Ring 3上的程序我们称为用户程序,而运行在Ring 0上的程序我们称为内核程序。

内核态与用户态

用户程序不能访问内核空间,如果想要调用内核程序进行IO操作,必须从用户态切换为内核态,等到内核处理完之后再切换为用户态。

用户程序进行IO操作时需要进行两次状态切换:用户态->内核态->用户态,具体流程如下:

  1. 用户态程序将一些数据值放在寄存器中,或者使用参数创建一个堆栈(stack frame),以此表明需要操作系统提供的服务
  2. 用户态程序执行陷阱指令
  3. CPU切换到内核态,并跳到位于内存指定位置的指令,这些指令是操作系统的一部分, 他们具有内存保护,不可被用户态程序访问
  4. 这些指令称之为陷阱(trap)或者系统调用处理器(system call handler),他们会读取程序放入内存的数据参数,并执行程序请求的服务
  5. 系统调用完成后,操作系统会重置CPU为用户态并返回系统调用的结果

内核缓冲区与用户缓冲区

用户程序每进行一次系统调用都会进行两次状态切换,频繁的状态切换会影响程序运行效率,缓冲区的作用就是为了减少系统调用。缓冲区分为两种:内核缓冲区与用户缓冲区:

IO读写流程

用户程序进行IO读写操作会发起系统调用,操作系统内核将磁盘数据读取到内核缓冲区,然后从内核缓冲区拷贝到用户缓冲区,流程如下:

零拷贝

是指计算机执行操作时,CPU不需要先将数据从某处内存复制到另一个特定区域。这种技术通常用于通过网络传输文件时节省CPU周期和内存带宽。若采用零拷贝技术,则能极大地增强了特定应用程序的性能,并更有效地利用系统资源。通过使CPU得以完成其他而非将机器中的数据复制到另一处的任务,性能也得到了增强。另外,零拷贝操作减少了在用户空间与内核空间之间切换模式的次数。

举例来说,如果要读取一个文件并通过网络发送它,传统方式下每个读/写周期都需要复制两次数据和切换两次上下文,而数据的复制都需要依靠CPU。通过零复制技术完成相同的操作,上下文切换减少到两次,并且不需要CPU复制数据。

不使用零拷贝

不适用零拷贝需要经历四次数据拷贝+三次状态切换

mmap + write

mmap + write方式减少了一次CPU拷贝

sendfile

sendfile方式不涉及CPU拷贝

IO模型

在讲解IO模型前,先了解下几个概念:阻塞与非阻塞、同步与异步:

阻塞IO

用户进程发起系统调用,如果数据还未准备完成,用户进程一直等待,直到数据准备完成,从内核缓冲区拷贝到用户缓冲区才返回成功提示,此次IO操作,称之为阻塞IO。缺点:如果数据没有准备好,则用户进程一直处于阻塞状态,如果想要同时处理很多请求,则需要为每个请求分配线程进行处理,系统开销较大。

非阻塞IO

用户进程发起系统调用,如果数据还未准备好,立刻返回状态标识,用户进程后续可以通过轮询的方式查看结果。缺点:虽然用户进程不阻塞了,但需要频繁的轮询获取结果,这样会导致频繁的系统调用,消耗大量的CPU资源。

IO多路复用

将IO事件注册到IO多路复用器(select/poll/epoll)上,select调用进程将一直阻塞直至注册在其上的任意一个IO时间数据准备完成时,才会返回。

信号驱动IO

用户进程发起系统调用,会向内核注册一个信号处理函数,然后进程返回不阻塞;当内核数据就绪时会发送一个信号给进程,进程便在信号处理函数中调用IO读取数据。

异步IO

用户进程发起系统调用后直接返回,等到处理完成,主动通知进程结果。

总结

对本文做个回顾:

用户进程运行在用户空间,只能访问受限资源,如果需要访问磁盘等硬件设备需要发起系统调用,从用户态切换为用户态;

为了减少频繁的系统调用,降低CPU消耗,讲解了内核缓冲区与用户缓冲区的作用;

IO读写流程,需要经历两次状态切换与两次数据拷贝;

零拷贝原理;

阻塞与非阻塞、同步与异步概念,四种同步IO模型,一种异步IO模型。

上一篇 下一篇

猜你喜欢

热点阅读