第 10章 向量处理机
10.1 向量处理机的基本概念
10.2 向量处理机的结构
10.3 向量处理机实例
10.4 向量协处理机
10.5 向量处理机的性能分析
10.1 向量处理机的基本概念
10.1.1 向量的概念
1,标量与向量运算
从数学的角度讲,向量是指既有大小又有方向的量
A=[a1,a2,a3,a4],B=
333231
232221
131211
bbb
bbb
bbb
2,向量处理方式
( 1) 水平 ( 横向 ) 处理方式
( 2) 纵向处理方式
( 3) 分组 ( 纵横 ) 处理方式
10.1.2 向量运算指令
1,寄存器 — 寄存器指令
( 1) 向量 -向量类指令 ( V-V)
( 2) 向量 -标量类指令 ( V-S)
图 10-2 V-S类指令的执行示意图运算功能部件
V j
1 2 … n
S k
V i
…
…
( 3) 向量 -存储器类指令 ( V-M)
( 4) 向量规约类指令
( 5) 收集发散指令
( 6) 屏蔽指令
2,存储器 — 存储器指令
M1(1,n)?M2(1,n)→ M(1,n)
S1? M1(1,n)→ M2(1,n)
M1(1,n)→ M2(1,n)
M1(1,n)?M2(1,n)→ M(k)
10.2 向量处理机的结构图 10-5 向量处理机的结构回写结果 C
取指令取操作数 B
取操作数 A
存储系统指令译码器功能流水线
10.2.1 存储器 — 存储器结构
存储器 — 存储器结构是指主存储器由多个存储模块组成,采用硬件倍乘的方法来支持对相互独立的数据进行并发访问,以达到存储器要求的带宽。
图 10-6 由 8个 3端口存储模块组成存储器系统的向量处理机
M
M
M
M
M
M
M
M
C= A Δ B
A
B
4 段流水线结构运算器
S
1
S
2
S
3
S
4
10.2.2 寄存器 — 寄存器结构图 10-9 Cray-1的系统结构
8 个向量寄存器 (V )
64 操作数寄存器主存储器
8 MB
64 模块
64 个缓冲寄存器 (T )
64 个缓冲寄存器 (B)
256 个指令缓冲寄存器
8 个标量寄存器 (S)
8 个地址寄存器 (A )
指令寄存器程序计数器
12 个流水结构的运算部件器中间寄存器 成组传送 高速寄存器流水线运算部件
10.3 向量处理机实例
10.3.1 银河 YH-1向量处理机图 10-10 YH-1系统结构处理部分双向量处理阵列标量运算部件地址运算部件指令控制部件
I / O
通道体 0
体 1
体 30
主存系统磁盘控制器用户处理机诊断处理机磁盘各种外设各种外设中央处理机
…
图 10-11 YH-1中央处理器的构成控制部件:各种指令控制部件主存储器:有 31 个存储体构成交叉访问的主存储器中央处理机寄存器组
8 个向量寄存器向量控制器
8 个标量寄存器地址寄存器功能部件向量功能部件标量功能部件浮点功能部件地址功能部件
10.3.2 Cray系列机
10.3.3 Fujitsu VP2000/VPP 500系列向量处理机
10.4 向量协处理机
10.4.1 向量协处理器的地位图 10-13 带向量协处理器的计算机系统结构高速总线标量处理机
(宿主机)
向量协处理器主存储器本地存储器
10.4.2 向量协处理器实例
1,FPS-164
图 10-14 FPS-164向量协处理器系统结构高速总线标量运算部件协处理器主存储器
1 2 0 MB
标量寄存器
X 寄存器组和 Y 寄存器组向量寄存器地址寄存器组( A )
间址寄存器组( T )
向量处理器向量处理器向量处理器乘法流水线加法流水线与宿主机相连图 10-15 FPS-164向量处理器的结构来自标量部件向量寄存器
4 × 8 K B
标量寄存器向量寄存器
4 × 8 K B
标量寄存器乘法器乘法器加法器加法器
2,NM6403协处理器
10.5 向量处理机的性能分析
1,向量指令的处理时间 Tvp
Tvp=Ts+Tvf+(n?1)Tc
图 10-16 向量指令执行时间
T s ( n - 1 ) T c T vf
2
第 1 个元素通过流水线建立段 3
n
2,向量流水线的最大吞吐率 R∞
R∞=
数循环所花费的时钟周期时钟频率浮点运算次数?
n l i m
R∞=
nnTn /l i m
时钟频率浮点运算次数
3,改进向量处理机性能的方法
( 1) 链接技术与并行操作
( 2)向量循环或分段开采技术
10.1 向量处理机的基本概念
10.2 向量处理机的结构
10.3 向量处理机实例
10.4 向量协处理机
10.5 向量处理机的性能分析
10.1 向量处理机的基本概念
10.1.1 向量的概念
1,标量与向量运算
从数学的角度讲,向量是指既有大小又有方向的量
A=[a1,a2,a3,a4],B=
333231
232221
131211
bbb
bbb
bbb
2,向量处理方式
( 1) 水平 ( 横向 ) 处理方式
( 2) 纵向处理方式
( 3) 分组 ( 纵横 ) 处理方式
10.1.2 向量运算指令
1,寄存器 — 寄存器指令
( 1) 向量 -向量类指令 ( V-V)
( 2) 向量 -标量类指令 ( V-S)
图 10-2 V-S类指令的执行示意图运算功能部件
V j
1 2 … n
S k
V i
…
…
( 3) 向量 -存储器类指令 ( V-M)
( 4) 向量规约类指令
( 5) 收集发散指令
( 6) 屏蔽指令
2,存储器 — 存储器指令
M1(1,n)?M2(1,n)→ M(1,n)
S1? M1(1,n)→ M2(1,n)
M1(1,n)→ M2(1,n)
M1(1,n)?M2(1,n)→ M(k)
10.2 向量处理机的结构图 10-5 向量处理机的结构回写结果 C
取指令取操作数 B
取操作数 A
存储系统指令译码器功能流水线
10.2.1 存储器 — 存储器结构
存储器 — 存储器结构是指主存储器由多个存储模块组成,采用硬件倍乘的方法来支持对相互独立的数据进行并发访问,以达到存储器要求的带宽。
图 10-6 由 8个 3端口存储模块组成存储器系统的向量处理机
M
M
M
M
M
M
M
M
C= A Δ B
A
B
4 段流水线结构运算器
S
1
S
2
S
3
S
4
10.2.2 寄存器 — 寄存器结构图 10-9 Cray-1的系统结构
8 个向量寄存器 (V )
64 操作数寄存器主存储器
8 MB
64 模块
64 个缓冲寄存器 (T )
64 个缓冲寄存器 (B)
256 个指令缓冲寄存器
8 个标量寄存器 (S)
8 个地址寄存器 (A )
指令寄存器程序计数器
12 个流水结构的运算部件器中间寄存器 成组传送 高速寄存器流水线运算部件
10.3 向量处理机实例
10.3.1 银河 YH-1向量处理机图 10-10 YH-1系统结构处理部分双向量处理阵列标量运算部件地址运算部件指令控制部件
I / O
通道体 0
体 1
体 30
主存系统磁盘控制器用户处理机诊断处理机磁盘各种外设各种外设中央处理机
…
图 10-11 YH-1中央处理器的构成控制部件:各种指令控制部件主存储器:有 31 个存储体构成交叉访问的主存储器中央处理机寄存器组
8 个向量寄存器向量控制器
8 个标量寄存器地址寄存器功能部件向量功能部件标量功能部件浮点功能部件地址功能部件
10.3.2 Cray系列机
10.3.3 Fujitsu VP2000/VPP 500系列向量处理机
10.4 向量协处理机
10.4.1 向量协处理器的地位图 10-13 带向量协处理器的计算机系统结构高速总线标量处理机
(宿主机)
向量协处理器主存储器本地存储器
10.4.2 向量协处理器实例
1,FPS-164
图 10-14 FPS-164向量协处理器系统结构高速总线标量运算部件协处理器主存储器
1 2 0 MB
标量寄存器
X 寄存器组和 Y 寄存器组向量寄存器地址寄存器组( A )
间址寄存器组( T )
向量处理器向量处理器向量处理器乘法流水线加法流水线与宿主机相连图 10-15 FPS-164向量处理器的结构来自标量部件向量寄存器
4 × 8 K B
标量寄存器向量寄存器
4 × 8 K B
标量寄存器乘法器乘法器加法器加法器
2,NM6403协处理器
10.5 向量处理机的性能分析
1,向量指令的处理时间 Tvp
Tvp=Ts+Tvf+(n?1)Tc
图 10-16 向量指令执行时间
T s ( n - 1 ) T c T vf
2
第 1 个元素通过流水线建立段 3
n
2,向量流水线的最大吞吐率 R∞
R∞=
数循环所花费的时钟周期时钟频率浮点运算次数?
n l i m
R∞=
nnTn /l i m
时钟频率浮点运算次数
3,改进向量处理机性能的方法
( 1) 链接技术与并行操作
( 2)向量循环或分段开采技术