CPU的运行和内存的介绍

2018-04-28 本文已影响0人项啊丑

废话不多说，开搞！

一：总线

1.每个CPU芯片都有许多管脚，这些管脚和总线相连，CPU通过总线跟外部器件进行交互

2.什么是总线？

总线就是一根根导线的集合

3.总线的种类？

<1> 地址总线

<2> 数据总线

<3> 控制总线

4.微型计算机的基本结构

下面看一张图

CPU从内存的3号单元读取数据

地址总线

地址总线的宽度决定了CPU的寻址能力

8086CPU的地址总线宽度是20，所以寻址能力是1M

怎么计算的呢？

这里比较绕，我仔细说下

假如我有两根地址总线，全部通电，它的值是11（二进制）也就是3，可以理解吗？

0（00）

1（01）

2（10）

3（11）

结合上图，那么它的寻址能力就是0 1 2 3，也就是4个字节

地址总线寻址能力的计量单位是Byte，公式是寻址能力= 2 ^ n，n是地址总线的宽度

那20根是多少呢？

答案是：2 ^ 20 B == 2 ^10 KB == 1 MB

如果对上面的表达式看不懂的话，那么你就需要了解B KB MB 的换算了

小常识：10根地址总线寻址能力是1KB

20根地址总线寻址能力是1MB

30根地址总线寻址能力是1GB

32根地址总线寻址能力是4GB（2^2 GB）这也是为什么32位系统内存最大只支持4G，更大的利用不了

数据总线

数据总线的宽度决定了CPU的单次数据传输量，也就是数据传输速度(俗称数据吞吐量)

8086的数据总线的宽度是16，所以单次最大传递2个字节的数据

这又是怎么计算的呢？看图

1Byte = 8bit

一个字节等于8位（8个二进制位），也就是说，8根数据总线可以组成8个二进制位的数据，也就是一个字节的数据，而16根数据总线能组成2个字节的数据

控制总线

控制总线的宽度决定了CPU对其他器件的控制能力，能有多少种控制

接下来做个小计算：

1 . 一个CPU 的寻址能力为8KB,那么它的地址总线的宽度为____

2. 8080,8088,80286,80386 的地址总线宽度分别为16根,20根,24根,32根.那么他们的寻址能力分别为多少____KB, ____MB,____MB,____GB?

3. 8080,8088,8086,80286,80386 的数据总线宽度分别为8根,8根,16根,16根,32根.那么它们一次可以传输的数据为:____B,____B,____B,____B,____B,

4. 从内存中读取1024字节的数据,8086至少要读____次,80386至少要读取____次.

答案我会放在最下面

二：内存

这几张图了解下就可以了，我们主要在ARM（主存储器中玩），其他的地方我们操作不了。

0x00000~0x9FFFF:主存储器。可读可写

0xA0000~0xBFFFF:向显存中写入数据，这些数据会被显卡输出到显示器。可读可写

0xC0000~0xFFFFF:存储各种硬件、系统信息。只读

内存地址空间的大小受CPU的地址总线宽度的限制，8086的地址总线宽度为20，可以定位(2^20)个不同的内存单元（内存地址范围0x00000~0xFFFFF），所以8086的内存大小为1MB

同样的问题，怎么计算的？

首先0x代表16进制，每一位都是16进制

那么0xFFFFF == 16^5 == 2^4^5 == 2^20 == 1MB（F等于10进制的16）

如过看不懂上面的公式没关系，接着往下看

三：进制

目前主流有4种进制

<1> 二进制：由二个符号组成（0 1）逢二进一

<2> 八进制：由八个符号组成（0 1 2 3 4 5 6 7）逢八进一

<3> 十进制：由十个符号组成（0 1 2 3 4 5 6 7 8 9）逢十进一

<4> 十六进制：由十六个符号组成（0 1 2 3 4 5 6 7 8 9 a b c d e f）逢十六进一

拓展：N进制：由N个符号组成逢N进一

注意：我说的是符号！符号！也就是说，你可以用任意数字，字母来组成任意进制，这有什么好处呢？两个字，安全。能在进制上做手脚进行加密安全操作的是非常高端的，所以它有个更重要的作用，装逼！

比如：

我用0 1 3 4 2 5 6 7 8 9 组成一个10进制

那么1+1=？

是不是等于3

这时候别人知道这个“3”的是真的“3”吗？

这就是进制加密的好处，安全！

进制的运算

八进制的运算：

2 + 3 = __ , 2 * 3 = __ ,4 + 5 = __ ,4 * 5 = __.

277 + 333 = __ , 276 * 54 = __ , 237 - 54 = __ , 234 / 4 = __ .

大家可以算下。对照下面的运算表，这可是神器哦，跟我们小时候背的99乘法表一样

进制之间的比对

看懂了进制之间的变换吗？

二进制：从0 写到 1111

0000 0001 0010 0011 0100 0101 0110 0111 1000 1001 1010 1011 1100 1101 1110 1111

这种二进制使用起来太麻烦，改成更简单一点的符号：

0 1 2 3 4 5 6 7 8 9 A B C D E F 这就是十六进制了

数据的宽度

数学上的数字，是没有大小限制的，可以无限的大。但在计算机中，由于受硬件的制约，数据都是有长度限制的（我们称为数据宽度），超过最多宽度的数据会被丢弃。

我写个例子，有兴趣的可以在Xcode上跑跑看

int max（）{

int max = 0x1FFFFFFFF

return max;

}

printf("%x\n",max());

看看最后输出的max()函数值是多少，是不是我们赋值的值？

计算机中常见的数据宽度

位(Bit): 1个位就是1个二进制位.0或者1

字节(Byte): 1个字节由8个Bit组成(8位).内存中的最小单元Byte.

字(Word): 1个字由2个字节组成(16位),这2个字节分别称为高字节和低字节.

双字(Doubleword): 1个双字由两个字组成(32位)

计算机中的存储数据它会分为有符号和无符号数。

四：寄存器

CPU内部部件之间由总线连接

对我们程序员来说，CPU中最主要部件是寄存器，可以通过改变寄存器的内容来实现对CPU的控制。它的作用就是进行数据的临时存储。

CPU的运算速度是非常快的，为了性能CPU在内部开辟一小块临时的存储区域，并在进行运算时陷阱数据从内存复制到这一小块临时存储区域中，运算时就在这一小块临时存储区域内进行，我们统称这一小块临时存储区域为寄存器

不同的CPU，寄存器的个数、结构是不同的

另外，还有一个概念--高速缓存

iPhoneX上搭载的ARM处理器A11它的一级高速缓存的容量时64KB，2级高速缓存的容量时8MB

CPU每执行一条指令前都需要从内存中将指令读取到CPU内并执行。而寄存器的运算速度相比内存读写要快得多，为了性能，CPU还集成了一个高速缓存-存储区域。当程序运行时，先将要执行的指令代码以及数据复制到高速缓存中去（这一步是由操作系统完成的）。而CPU直接从高速缓存中依次读取指令来执行。

内存地址与高速缓存之间有个一一对应的映射关系，当我们读取指令的时候，pc寄存器指向谁，我们就读谁，当我们pc的地址给了CPU，它其实我们是去高速缓存中寻找，因为它们是映射关系

还有一个问题：当高速缓存中8MB的地址全部用完了怎么办，pc所指向的地址在高速缓存中找不到了怎么办？

不要急，因为这时候会重新从内存中cpoy一份到高速缓存中去，它中间其实有个高速缓存的这个过程

那么为什么不将整个内存条都做成高速缓存区域呢？只开辟出8MB？

越是高效，越是精良的硬件，它的做工要求就更高，成本就更高！

1.通用寄存器

ARM64拥有31个64位(每个寄存器是64位的，CPU是64位的)的通用寄存器x0到x30，这些寄存器通常用来存放一般性的数据，成为通用寄存器（有时候也有特定用途）

咦？不是说是x0到x30吗？为什么只有到x28？

注意：fp就是x29，lr就是x30

并且：sp我们俗称它是x31，但是它不属于通用寄存器

w0到w28是32位的，但是64位的CPU可以向下兼容32位，所以只使用64位寄存器的低32位，如w0就是x0的低32位

这些寄存器是怎么看的呢，打开Xcode，运行程序，大哥断点，然后将这个选为all（原来是auto）

通常CPU会先讲内存中的数据存储到通用寄存器中，然后再对通用寄存器中的数据进行运算

举个例子：

假设内存中有快红色空间的值是3，现在想把它的值加1，并将结果存储到蓝色内存空间

<1> CPU首先会会将红色内存空间的值放到x0寄存器中：

mov x0，红色内存空间（伪代码）

mov 数据传送指令（相当于赋值）

上面伪代码的意思就是将红色空间的值移动到x0中

<2> 让后让x0寄存器与1相加：add x0，1 （伪代码）

add 相加指令

意思是将x0的值加1 再存到x0中

<3> 最后将值赋值给内存空间：mov 蓝色内存空间，x0 （伪代码）

这句代码的意思就不说了，自己想

注意：我们所有运算都不能直接拿内存中的数据进行直接计算，必须要把值放到寄存器中进行运算！运算结束后再写进内存中。

2.pc寄存器（program counter）

重点，很有意思

<1> 为指令指针寄存器，它指示CPU当前要读取指令的地址

<2> 在内存或者磁盘上，指令和数据没有任何区别，都是二进制信息

<3> CPU在工作的时候把有的的信息看作指令，有的信息看做数据，为同样的信息赋予了不同的意义

例：

比如 1110 0000 0000 0011 0000 1000 1010 1010

可以当作数据 0xE003008AA

也可以当作指令 mov x0，x8

<4> CPU根据什么将内存的信息看作指令呢？

CPU将pc指向的内存单元的内容看作指令

如果内存中的某段内容曾被CPU执行过，那么它所在的内存单元必然被pc指向过

接下来演示一下这个有意思的pc

我们现在断点在0x102b58bac这个地址上对吧！

ni是单行执行下一步的操作

之前有说过通过改变寄存器的内容来实现对CPU的控制

那么现在就来改一下

当前这个寄存器的内容地址是0x102b58bac

现在我将它改掉

这句代码 register write pc 0x102b58b94

它的意思是将当前pc寄存器的地址改为0x102b58b94

当我们进行ni操作的时候

咦？

它并没有执行到下一步地址为0x102b58bb0的操作，而是进到了我们改动的内存地址下，是不是‘哦莫西罗伊’

3.数据地址寄存器

数据地址寄存器通常用来做数据计算的临时存储、累加、计数、地址保存等功能。定义这些寄存器的作用主要用于在CPU指令中保存操作数，在CPU中当做一些常规变量来使用。

ARM64（CPU）中

64位：X0-X30，XZR（零寄存器）

32位：W0-W30，WZR（零寄存器）

注意：在Inter架构CPU中还有中特殊的寄存器-段寄存器：CS、DS、SS、ES，主要是用来保存这些段的基地址。但是ARM中是没有的。

4.浮点和向量寄存器

因为浮点数的存储以及运算的特殊性，CPU中专门提供浮点数寄存器来处理浮点数

<1>浮点数寄存器：

64位：D0-D31

32位：S0-S31

目前的CPU它支持向量运算（向量运算在图形处理相关的领域用的非常多）。喂了支持向量计算，系统也提供了众多的向量寄存器。

<2>向量寄存器：

128位：V0-V31

5.SP和FP寄存器

<1> sp寄存器在任意时刻会保存我们栈顶的地址

<2> fp寄存器也叫做x29寄存器，它属于通用寄存器，但在某些时刻我们利用它保存栈底的地址

<3> 另外：ARM64开始，取消了32位的LDM，STM，PUSH，POP指令，取而代之的是ldr\ldp str\stp

ldr\ldp str\stp 这些都是内存读写指令

注意：读/写操作都是数据往高地址中进行读/写

str（store register）指令

将数据从寄存器中读出来，存到内存中

ldr（load register）指令

将数据从内存中读出来，存到寄存器中

ldp和stp是str和ldr的两个变种指令

<4> ARM64里面，对栈的操作是16字节对齐的

延伸：什么是栈？

栈：一种遵循后入先出法（LIFO）的特殊访问方式的存储空间

什么叫后入先出法？

Last In Out First. 最后一个进去的，第一个出来

有个举烂的例子：

将羽毛球放到羽毛球筒中，最后一个放进去的羽毛球肯定是第一个拿出来

5.bl指令

<1> CPU从何处执行指令是pc中的内容决定的，我们可以通过改变pc的内容来控制CPU执行目标指令

<2> ARM64提供了一个mov指令（传送指令），可以用来修改大部分寄存器的值

如：

mov x0,#10、mov x1,#20

这里解释下#号的含义

#后面跟数字，它有个概念，叫“立即数”

什么事立即数？

就是它代表的是个数字，而不是符号！

听懂没，之前说进制的时候，说0 1 2…… 这些是符号

当前面加上#号后，它就代表数字了

所以mov x0,#10这条指令的意思就是：把10这个数放到x0中

<3> but，mov指令不能用于设置pc的值，ARM64没有提供这样的功能

如：mov pc,#0x102b58bb0 这条汇编指令是错误的，不能这么写

<4> ARM64提供了另外的指令来修改PC的值，这些指令统称为转移指令，最简单的就是bl指令

计算题答案

1. 之前有说10根地址总线的寻址能力是1KB，那么8KB == 8 * 1 KB == 2^3 *1KB == 2^3 * 2^10 B = 2^13 B

所以地址总线的宽度是13

2.同样的计算方式

<1> a: 2^16B == (2^10B)^6 KB == 2^6 KB == 64KB

<1> b: 2^20B == 2^10 KB == 1MB

<1> c: 2^24B == b^4 MB ==16MB

<1> d:2^32B == 2^2 GB = 4GB(上面有提到30根地址总线的寻址能力是1GB)