Linux内核学习1——基本概念
linux源码下载地址:http://www.kernel.org
《深入理解Linux内核》读书笔记
1.Linux与其他类Unix内核的比较
类Linux内核通常采用相同的设计思想和特征。Linux包含了现代Unix操作系统的全部特点,诸如虚拟内存、虚拟文件系统、轻量级进程、Unix信号量、SVR4进程间通信、支持对称多处理器(Symmetic Multiprocessor, SMP)系统等。
Linux内核的一些描述:
- 单块结构的内核 它是一个庞大、复杂的自我完善程序,由几个逻辑上独立的成分构成。
- 编译并静态连接的传统Unix内核 大部分现代操作系统内核可以动态的装载和下载部分内核代码,通常把这部分代码叫做模块(module)。
- 内核线程 内核线程是一个能被独立调度的执行环境(context)。线程之间的上下文切换比普通进程之间的上下文切换话费的代价要少的多,因为前者通常在同一个地址空间执行。Linux以这一种十分有限的方式是用内核线程来周期性地执行几个内核函数;但是,它们并不代表基本的执行上下文的抽象。
- 多线程应用程序支持 用户程序根据喝多相对独立的执行流来设计的,这些执行流共享应用程序的大部分数据结构。一个多线程用户程序由很多轻量级线程(LWP)组成,这些进程可能对共同的地址空间、共同的物理内存页、共同的大开文件等等进行操作。
- 抢占式内核 Linux2.6可以支持不同存储模式的对称多处理。
- 文件系统 丰富的文件系统。
- STREAMS Linux并没有STREAM I/O 子系统。
Linux的优势:
- Linux是免费的
- Linux的所有成分都可以充分定制
- Linux可以运行在低档、便宜的硬件平台上
- Linux系统速度非常快,效率高
- 稳定、非常低的故障率和非常少的维护时间
- 内核非常小,而且紧凑
- 与许多通用操作系统高度兼容,能够与进行很多网络层操作,甚至能直接运行为其他操作系统编写的程序
- 有很好的基础支持
2.操作系统基本概念
内核就是操作系统的基本程序集合
操作系统必须完成两个主要目标:
- 与硬件部分交互,为包含在硬件平台上的所有低层可编程不见提供服务。
- 为运行在计算机系统的应用程序提供执行环境。
硬件为CPU引入了至少两种不同的执行模式:用户程序的非特权模式和特权模式。Unix把他们称为用户态和内核态。
多用户系统
多用户系统就是一台能并发和独立执行分别属于两个货多个用户的若干应用程序的计算机。“并发”以为着几个应用程序能同事处于活动状态并竞争各种资源。“独立”意味着每个程序能执行自己的任务。多用户系统必须包含以下几个特点:
- 核实用户身份的认证机制
- 防止有错误的用户程序妨碍其他应用程序在系统中运行的保护机制。
- 防止有恶意的用户程序干涉和窥视其他用户的活动的保护机制
- 限制分配给每个用户的资源数的记账机制。
进程
进程:一个进程可以定义为:"程序执行时的一个实例“,或者一个运行程序的“执行上下文”。现代操作系统允许具有多个执行流的进程,也就是说,在相同的地址空间可执行多个指令序列。
允许进程并发活动的系统称为多道程序系统或多处理系统。区分程序和进程是非常重要的:几个进程能并发地执行统一程序,而同一个进程能顺序地执行几个程序。
一些操作系统只允许有非抢占式进程,这就意味着,只有当进程资源放弃cpu的时候,调度程序才被调用。但是,多用户系统中的进程必须是抢占式的;操作系统记录下每个进程占用的CPU时间,并周期性的激活调度程序。
类Unix操作系统采用进程/内核模式。每个进程都自以为他是系统中唯一的进程,可以独占操作系统所提供的服务。只要进程发出系统调用,硬件就会把特权模式有用户态变为内核态,然后进程以非常有限的目的开始一个内核过程的执行。这样,操作系统在进程的执行上下文中起作用,以满足进程的请求,一旦这个请求完全得到满足,内核过程将迫使硬件返回到用户态,然后进程从系统调用的下一条指令继续执行。
内核体系结构
- 单块结构:每一个内核层都被集成到整个内核程序中,并地表当前进程在内核态下运行。
- 微内核:操作系统只需要一个很小的函数集,通常包含几个同步原语、一个简单的调度程序和进程间通信机制。运行在微内核之上的几个系统进程实现从前操作系统级实现的同能,比如内存分配程序、设备驱动程序、系统调用处理程序等等。
微内核比单块内核的效率低,因为操作系统不同层次之间显式的消息传递要花费一定的代价。但微内核具有一定的理论优势。微内核破事程序员采用模块化的方法,因为任何操作系统层都是一个行对独立的程序,这种层序必须通过定义明确而清晰的软件接口与其他层交互。另外,微内核更容易被移植到其他体系结构上,因为所有与硬件相关的部分都被封装在微内核代码中。最后,微内核操作系统比单块内核更加充分利用RAM,因为暂且不需要执行的系统进程可以被调出或撤销。
而Linux提供了模块(module)。模块是一个目标文件,其代码可以运行时链接到内核或者从内核解除链接。
模块的主要优点包括:
- 模块化方法 因为任何模块都可以在运行是被链接或解除链接,因此,系统程序员必须提出良定义的软件接口以访问由模块处理的数据结构。这使得模块变得容易。
- 平台无关性 不依赖硬件特点
- 节省内存使用 可以将模块解除链接,对于嵌入式系统很有用。
- 无性能损失 模块的目标代码一旦被链接到内核,起作用与静态链接的内核的目标代码完全等价。函数被调用时,无需显式的消息传递。
3.Unix文件系统概述
文件
大家都和熟悉,文件被组织在一个树结构的命令空间中。
硬链接和软链接
包含在目录中的文件就是一个文件的硬链接(hard link),或称链接(link)。Unix可以用命令来创建一个链接。
硬链接有两方面限制:
- 不允许用户给目录常见硬链接,因为这可能吧目录树变为环形图,从而就不可能通过名字定位一个文件。
- 只有在同一文件系统的文件之间才能穿件链接。这带来比较大的限制,因为Unix系统中包含了多种文件系统。
为了克服这些限制,引入了软连接,也叫符号链接。符号链接是段文件,这些文件包含有另一个文件的任意一个路径名。路径名可以指向位于任意一个文件系统的任意文件或目录。甚至指向一个不存在的文件。
文件类型
- 普通文件
- 目录
- 符号链接
- 面向块的设备文件
- 面向字符的设备文件
- 管道和命名管道
- 套接字
前三种是所有Unix文件系统的基本类型。
文件描述符与索引节点
文件系统处理文件需要的所有信息包含在一个名为索引节点的数据结构中。每个文件都有自己索引节点,文件系统用索引节点标识文件。
文件操作的系统调用
4.Unix内核概述
当一个程序在用户态执行的时候,他不能直接访问内核数据结构或内核的程序。然而,当应用程序在内核态下运行时,这些限制不再有效。每种CPU模型都为从用户态到内核态的转换提供了特殊的指令,反之亦然。一个程序执行时,大部分时间都处在用户态下,只有需要内核提供服务时,才切换到内核态。当内核满足了用户程序的请求后,他让程序又回到用户态下。
Unix系统还包括几个所谓内核进程和特权进程,它们具有以下特点:
- 它们以内核态运行在内核地址空间。
- 它们不予用户直接交互,因此不需要终端设备。
- 它们通常在系统启动时创建,然后一直处于活跃状态直到系统关闭。
可重入内核 所有Unix都是可重入的,这意味着若干个进程可以同时在内核态下执行。当然,但处理器系统只有一个进程在真正运行。