Cache 的基础知识以及映射
前言:继续补硬件知识
存储器的层次结构
列出的时间和容量会随时间变化,但数量级相对关系不变。
层次化存储器结构(Memory Hierarchy)
为什么这种结构会有用
-
刚被访问的单元可能不久又被访问
这叫做时间局部性。比如循环访问的数组单元啊。解决办法,就是把被访问的单元的信息保留在靠近 CPU 的存储器中。
-
刚被访问过的单元的邻近单元很可能不久被访问
这叫做空间局部性。比如遍历整个数组啊。解决办法,就是把被访问的单元的邻近单元保留在靠近 CPU 的存储器中。
这种结构就是位于 CPU 和 MM(Main Memory)的 Cache。
如何操纵 Cache
整个简单的流程就是上面的图片那样。
有几点需要注意:
- 在可执行文件中,程序给的是虚拟地址。不是真正主存地址,那 CPU 又是怎么给出主存地址呢?这是另外一个话题。。。(等我学会了我再写出来)
- 是把包含 AD 内容的块读入 Cache 中,而不是仅仅把 AD 的内容放入 Cache 中
理解 Cache 的映射方式
有三种映射方式:
- 直接(Direct): 每个主存的映射到 Cache 固定行
- 全相联(Full Associate):每个主存映射到 Cache 的任一行
- 组相联(Set Associate):每个主存映射到 Cache 的固定组的任一行
你可能对 Cache 的行还不是很了解。我会在例子中给出
直接映射
行号就是槽号
- 把整块主存分为 128 块群
- 每块群有 16 块
槽号的计算方式,假设有 16 行,也就是有 16 个槽号
槽号 = 块群 % 16
举个栗子:
右边第 17 块就应该放在 17 % 16 = 1
的槽号里面。
继续来说说主存地址
的主存标记
和块内地址
。主存地址就是来找主存单元的。假设我们已经有了「槽号」。
-
主存标记
现在,我们有槽号了,也就是知道我们要找的块在块群的哪个位置了。但是我们不知道他是属于哪个「块群」。
主存标记
就是用来存储块群的。一共有 128 个块群。所以一共有 7 位
-
块内地址
现在我们能够找到,这一块属于哪个块群的哪个块了。但是,我们找的是内存单元。一个「块」里面有很多个内存单元。在这里我们假设:每一个 块 = 512B。也就是说,要精确到内存单元的地址。需要 9 位地址。也就是块内地址。
用一个例子来解释直接巩固一下,直接映射
这个题的解题思路如下:
- 首先要明白主存地址有三个部分:
Cache 槽号
主存标记
和块内地址
- 因为,一个块是 16B,所以块内地址就是 4 位
- 因为,数据总量是 64KB,所以行号就是 64KB / 16B = 4 KB 也就是 12 位
- 剩下的 16 位就是标签,也就是
主存标记
了
在注意一点:这里多出来了一位 V
V 代表:
- 为 1 表示信息有效,为 0 表示信息无效
- 开机或复位时,使所有行的有效位 V = 0
- 某行被替换后使其 V = 1
- 某行装入新块时 使其 V = 1
- 通过使 V = 0 来冲刷 Cache(例如:进程切换时,DMA传送时)
好的,我们继续来说说全相联(Full Associate)
全相连(Full Associate)
全相联就是:每一个块可以放在 Cache 的任何位置。
所以没有槽号这一说了,只剩下标记用来标记第多少块。
这两者都不好,最后说说这两者的结合:组相联(Set Associate)
组相联(Set Associate)
组相联(Set Associate)干了什么呢(还是原来的例子):
-
保留了直接映射的特点:「槽号」
但是槽号其实是变小了,只分了 8 组。也就是只有三位,原来是 1 块 1 组。现在是 2 块一组。
-
在每一槽里面使用全相联:
也就是说,每一槽不是有两行吗?两行可以随便放。就跟全相联一样,只不过全相联是把整个 Cache 都随便放了