自动化专业

第六讲 流水线处理器(Pipelined Processor)

2019-12-25  本文已影响0人  Lynn_4f26

内容要点:流水线,相关和冒险

1. 流水线基本原理

  1. 执行指令的主要步骤(MIPS)
1. 取指(Fetch) 从存储器取指令,更新PC
2. 译码(Decode) 指令译码,从寄存器堆读出寄存器的值
3. 执行(Execute) 运算指令:进行算术逻辑运算
访存指令:计算存储器地址
4. 访存(Memory) Load指令:从存储器读数据
Store指令:将数据写入存储器
5. 回写(Write-back) 将数据写入寄存器堆
添加流水线寄存器.png

2. 流水线寄存器性能分析

3. ”超级流水线“技术(Super Pipelining)

  1. 将五级流水线细分为更多的阶段,增加流水线的深度
  2. 提升时钟频率,从而提高指令吞吐率
  3. 比如:5级(T=200ps+50ps=250ps)=>10级(T=100ps+50ps=150ps)
  4. 但单条指令延迟:5级(250*5=1250ps)=> 10级(150*10=1500ps)
  5. 级数不是越多越好(现在一般15级左右)
    • 13年,Core i7(Haswell):14级
    • 13年,Cortex-A57:15级

4. 超标量流水线

  1. 超标量结构(Superscalar):通常具有两条或两条以上并行工作的流水线结构
  2. 使用该结构的处理器称为超标量处理器
  3. 标量和超标量流水线
    • 单周期 -> 标量流水线:时间并行性的优化,主要是对现有硬件的切分
    • 标量 -> 超标量:空间并行性的优化,需成倍增加硬件资源
  4. 超标量流水线与多核CPU
    • 现代的多核CPU通常是在一个CPU芯片中集成了多个超标量处理器核
  5. Pentium的超标量流水线(第一款超标量X86 CPU)
    • 两条流水线:”U流水“和”V流水“
    • 每条流水线都拥有自己的地址生成逻辑、ALU及数据Cache接口
    • 在一个时钟周期内,可以同时发送两条指令
  6. CDC6600:第一台超级计算机(1964)
  7. Cortex-A9的超标量流水线
    • 4发射,8~11级流水
  8. Core i7的超标量流水线
    • 4发射,16级流水

5. 冒险(Hazard)

阻止下一条指令在下一个时钟周期开始执行的情况

  1. 结构冒险

    • 所需要的硬件部件正在为之前的指令工作

      1. 如果指令和数据放在同一个存储器中,则不能同时读存储器

        • 解决方案1:流水线停顿(stall),产生空泡(bubble)

        • 解决方案2:指令和数据放在不同的存储器中

      2. 如果读寄存器和写寄存器同时发生

        • 解决方案:前半个时钟周期写,后半个读,并且设置独立的读写口
  2. 数据冒险

    • 需要等待之前的指令完成数据的读写

      1. 一条指令需要使用之前指令的运算结果,但是结果还没有写回

        sub $t0, $s1, $s2
        add $s3, $t0, $s4 # $t0 是上一条减法指令的结果
        and $s5, $s4, $t0 #  $t0 是上上条减法指令的结果
        instruction 4
        
        • 解决方案1:流水线停顿(stall),产生空泡(bubble)
      • 软件解决方案:插入nop指令
        • 解决方案2:数据前递(Forwarding)/旁路(Bypass)
      1. 一条指令需要使用之前指令的访存结果(Load-Use Harzard)

        lw $t1, 20($t0)
        or $t2, $t1, $t5 
        
        • 解决方案:流水线停顿 + 数据前递
  3. 控制冒险

    • 需要根据之前指令的结果决定下一步的行为

      1. 尚未确定是否发生分生
      beq ...
      instruction 1
      instruction 2
      instruction 3
      
      • 解决方案1:流水线停顿(stall),产生空泡(bubble)

6. 转移指令对流水线的影响

7. Quiz:

  1. MIPS的五级流水线结构中,读寄存器堆是在哪个阶段完成的?<u>译码</u>
  2. MIPS的五级流水线结构中,计算访存的地址是在哪个阶段完成的?<u>执行</u>
  3. 对于典型的MIPS五级流水线处理器,按照指令执行的正常流程,beq指令的分支条件判定会在哪个阶段完成?<u>执行</u>
上一篇 下一篇

猜你喜欢

热点阅读