Lecture 1: Brief Introduction

2018-03-03  本文已影响0人  星月曜辉

Lecture 1: Brief Introduction

对ICS的简单回顾

已经学过的几种并行模式:

对并行计算中几个重要问题的论述

  1. 计算密集型:
    • 比特币:利用随机数碰撞产生答案,最后挖矿的效果主要受计算的效果限制。
    • 为什么计算密集:对于存储器访问少,主要可以存储于寄存器
    • 计算机中最难做的是数据的传输,但是比特币主要利用GPU或者专用ASIC的计算能力
    • 不需要数据传输的并行是embarrassing parrallel,并没有什么难度
  1. 访存密集:

    • 比如GDDR在芯片外面存储信息,由于传输速度的限制,传输数据到计算单元的速度低于计算速度
    • 表现:访存带宽充满(90%+),运算单元吃不饱(20%+),瓶颈在于数据传输
    • 过去几年浮点定点大幅提高,但是传输速度只是线性增加
    • 访存密集型任务在真实并行任务中大量存在
  2. 通讯密集:

    • 瓶颈不再是运算,也不再是数据搬运

    • 以排序算法为例,在单个服务器上是访存密集型任务,受制于芯片与内存传输的带宽,计算复杂性较低

    • 数据量到达一定程度,需要放置在多个服务器中进行工作。

      考察下面的例子:比如我们的服务器从1台到100台:

      计算能力(CPU) *100

      访存带宽(共同访存) *100

      但是并不是这样的情况就会让我们的性能提升100倍,因为这里需要大量服务器之间的交互

    • 通讯量上升巨大,瓶颈变成了网络带宽(GB/S)

  3. 访外存密集:

    • 某些大数据场景,以地震数据为例,数据量极其巨大,内存根本放不下
    • 采用分布式外排序算法,数据都存放在外存中
    • 如果硬盘很慢,那么瓶颈在于硬盘带宽
    • 硬盘带宽提升迅速

并行计算解决的一些实际问题

一点后话:

上一篇 下一篇

猜你喜欢

热点阅读