Read-程序是怎样跑起来的

2017-11-13  本文已影响0人  SouthBegonia
程序是怎样跑起来的

作者:矢泽久雄[日]
译者:李逢俊

  本文为对《程序是怎样跑起来的》一书内容的整理和概括,部分图片,文字摘选自书籍,如有任何侵权行为请联系作者第一时间删除,谢谢。


对程序员来说CPU是什么


CPU的内部结构解析

  CPU(Central Processing Unit)职责: 解释运行转换成机器语言的内容。

程序运行流程示例:

  1. 用C语言等高级语言编写程序。
  2. 将程序编译后转换成机器语言的EXE文件。
  3. 程序运行时,在内存中生成EXE文件的副本。
  4. CPU解释并执行程序内容。

CPU内部组成:寄存器(20~100个),控制器,运算器,时钟(电流信号相互连通)。

寄存器: 暂存指令,数据等处理对象。
        一个CPU内部会有20~100个寄存器。
控制器: 把内存上的指令,数据等读入寄存器,并根据指令的结果来控制整个计算机。
时钟:   发出CPU开始计时的时钟信号(clock puzzle,频率越高CPU运行速度越快)。

    CPU内存是由许多晶体管组成的电子部件,通常称为:IC(Integrated Circuit,集成电路)。
    内存(main memory,简称主存):主存通过控制芯片等与CPU相连,主要负责储存指令数据。储存的内容随计算机的关闭而自动清除。通常使用DRAM(Dynamic Random Access Memory,动态随机存取储存器)芯片。

CPU是寄存器的集合体

程序是把寄存器作为对象来描述的。

    通常,将汇编语言编写的程序转化成机器语言的过程称为汇编;反之,机器语言程序转换成汇编语言程序的过程称为反汇编
    把汇编语言转换成机器语言的程序称为汇编器(assembler)。
    把高级语言转换成机器语言的程序称为编译器(compiler)。

/* 汇编语言编写的程序事例  */
mov eax, dword ptr [ebp-8]          //把数值从内存复制到exa
add eax, dword ptr [ebp-0Ch]        //exa的数值和内存的数值相加
mov dword ptr [ebp-4], exa          //把exa的数值(上一次相加的结果)储存在内存中

    高级语言编写的程序在编译后转换成机器语言,然后通过CPU内部的寄存器来处理。
    寄存器中储存的内容既可以是指令也可以是数据。数据分为“用于运算的数值”“表示内存地址的数值”
     8种寄存器的主要种类和功能 如下表:

种类 功能
累加寄存器( accumlulator register ) 储存执行运算后的数据和运算后的数据
标志寄存器( flag register ) 储存运算处理后的CPU状态
程序计数器( program counter ) 储存下一条指令所在的内存的地址
基址寄存器( base register ) 储存数据内存的起始地址
变址寄存器( index register ) 储存基址寄存器的相对地址
通用寄存器( general purpose register ) 储存任意数据
指令寄存器( instruction register ) 储存指令。CPU内部使用,程序员无法通过程序对该寄存器进行读写操作
栈寄存器( stack register ) 储存栈区域的起始地址
寄存器数量 寄存器种类
仅有一个 程序计数器,标志寄存器,累加寄存器
含有多个 基址寄存器,变址寄存器,通用寄存器

CPU是寄存器的集合体

决定程序流程的程序计数器

    实际上一个命令和数据通常被储存在多个地址上,为了方便说明把指令和数据分配到一个地址中。
    假设地址0100为程序开始的位置。Windows等操作系统把程序从硬盘复制到内存后,会将程序计数器设定为0100,然后程序便开始运行。CPU每执行一条指令,程序计数器自动+1。然后CPU的控制器会参照程序计数器的数值,从内存中读取命令执行

条件分支和循环机制

程序的流程分为:

    条件分支和循环中使用的跳转指令,会参照当前执行的运算结果来判断是否跳转。无论当前累加寄存器的运算结果是负数,零或正数,标志寄存器都会将其保存。(也负责存放溢出和奇偶校验的结果)。

函数的调用机制

    单纯的跳转指令无法实现函数的调用,而是通过把程序计数器的值设定为函数的储存地址来实现。函数的调用需要在完成函数内部的处理后,处理流程再返回到函数的调用点(函数调用指令的下一地址)。因此,如果只是跳转到函数的入口地址,处理流程就不知道该返回到哪了。
    函数的调用使用call指令,在将函数的入口地址设定到程序计数器前,call指令会把调用函数后要执行的指令地址储存在名为的主存内。函数处理完后,再通过函数的出口来执行return命令(把保存在栈中的地址设定到程序计数器中)。

栈(stack):在程序领域中,栈表示不断储存各种数据的内存区域。函数调用能够返回调用前的地址就是因为栈。

通过地址和索引实现数组

    我们用十六进制数将计算机内存上00000000~FFFFFFF的地址划分出来。

实际查看的内存地址 = 基址寄存器的值 + 变址寄存器的值

    例如:要访问10000000~1000FFFF地址时,把10000000存入基址寄存器(基址寄存器的值被固定),然后变址寄存器中的值可在00000000~0000FFFF内变化,变址寄存器中的值,就相当于高级语言程序中数组的索引功能
    (用一个数组名来表示全体数据,通过索引来区分数组的各个数据。如,一个10元素的数组a,数据表示为a[0] ~ a[9],其中的数字0~9就是索引)

CPU处理简述

    下表对CPU能执行的机器语言指令进行分类。

类型 功能
数据转送指令 寄存器和内存,内存和内存,寄存器和外围设备之间的数据读写操作
运算指令 用累加寄存器的执行算术运算,逻辑运算,比较运算和移位运算
跳转指令 实现条件分支,循环,强制跳转等
call/return指令 函数的调用 / 返回调用前的结果

有关计算机二进制对数据进行表示及处理可参考:
明明是悟空 - 二进制的计算(计算机为什么采用补码储存数据)
张晓军 - 计算机中数的表示及运算

持续更新... ...

作者:SouthBegonia
链接:http://www.jianshu.com/p/q81RER/
來源:简书
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

上一篇下一篇

猜你喜欢

热点阅读