0%

计算机系统结构-阵列处理机

计算机系统结构-阵列处理机

5.1 阵列处理机的操作模型和例子

阵列处理机(Array Processor)

核心:一个由多个处理单元构成的阵列
采用资源重复的方法,设置较多的处理单元来提高并行性
用单一的控制部件来控制多个处理单元对各自的数据进行相同运算和操作

阵列处理机的操作模型

用一个控制部件CU同时管理多个处理单元PE
CU对指令进行译码,并把指令传送到各处理单元
所有处理单元均被动地接收并执行从控制部件广播来的同一条指令,但它们所操作的对象却是不同
阵列处理机的操作模型

阵列处理机的五元组模型

阵列处理机=(N,C,I,M,R)
其中:
N:机器处理单元数(PE)
C:控制部件CU直接执行的指令集,包括标量指令和程序流控制指令
I:由CU广播至所有PE进行并行执行的指令集
M:屏蔽方案集
R:数据寻径功能集

阵列处理机实例

Illiac IV阵列处理机
BSP阵列处理机

阵列处理机的特点

1.以单指令流多数据流方式工作
2.通过设置多个相同的处理单元来开发并行性.利用并行性中的同时性,而不是并发性。所有处理单元必须同时进行相同的操作
3.以某一类算法为背景的专用计算机
4.阵列机的研究必须与并行算法的研究密切结合,以便能充分发挥它的处理能力
5.阵列机的控制器实质上是一台标量处理机

5.2 阵列处理机的基本结构

分布式阵列处理机的基本结构

分布式阵列处理机

各种阵列处理机的主要差别:数据寻径网络的不同

共享存储器阵列处理机的基本结构

共享存储器阵列机

应当减少访存冲突

5.3 阵列处理机的并行算法距离

矩阵加

把每个矩阵对应元素分配到对应位置,但是需要分配许多存储单元,例如对于8x8矩阵需要64个存储单元
矩阵加

矩阵乘

矩阵乘需要三重循环,8x8x8一共512次相乘加等,包括循环判别时间,比较麻烦