哈尔滨工业大学计算机科学与技术学院 1
并行处理与体系结构
哈尔滨工业大学计算机科学与技术学院 2
第 3章 性能指标和基准程序
??1 系统和应用的基准程序
??2 性能和成本
??3 基本性能指标
??4 并行计算机性能
??5 并行程序性能
??6 可扩展性和加速比分析
哈尔滨工业大学计算机科学与技术学院 3
1,如何描述应用和系统的性能特征?
2,什么是用户对性能和成本要求?
3,如何测量应用程序的性能? 使用何种
类型的性能指标?
4,当在并行计算机上执行并行程序时,
如何描述系统性能的特征?
5,影响性能的参数有哪些? 典型的参数
值为多少?
6,如何量化和分析系统可扩展性?
7,如何确定执行给定应用问题的并行机
的可扩展性?
哈尔滨工业大学计算机科学与技术学院 4
?一、前言
? 基准程序是性能测试程序,并假设它
能刻划某一类应用问题的处理和数据
移动的特征。
? 基准程序用来测量和预测计算机系统
的性能,并能提示它们的体系结构的
弱点和优点。
?1 系统和应用的基准程序
哈尔滨工业大学计算机科学与技术学院 5
?基准程序分类,
( 1)按应用类
( 2)按计算机系统来分基准程序
?宏基准程序
? 宏基准程序测量一个计算机系统的总
体性能。
?微基准程序两类
? 微基准程序测量一个计算机系统的某一
特定方面性能。
哈尔滨工业大学计算机科学与技术学院 6
哈尔滨工业大学计算机科学与技术学院 7
?二、微基准程序
? 包括,3个微基准程序组。
?1.LINPACK
?LINPACK基准程序由田纳西大学的
Jack Dongarra 创作并加以维护。
?LINPACK简单实用,它定期公布有关
各种系统的 LINPACK性能数值表。
? 包括 Top 500表,它列出了世界上功能最
强的 500台计算机。
哈尔滨工业大学计算机科学与技术学院 8
Return
哈尔滨工业大学计算机科学与技术学院 9
?2.LMBENCH
?LMBENCH基准程序组由 SGI的
LarryMcVoy提出,是一个可移植的
基准程序。
? 在各种 Unix平台上,用来测量操作
系统开销和处理器、高速缓存、存
储器、网络及磁盘。
哈尔滨工业大学计算机科学与技术学院 10
属 性 Intel
Alder
Sun Ultra IBM 990
带宽 (MB
/ s)
存储器复制
读文件
管道
TCP
52
52
38
20
85
85
61
51
242
187
84
10
时延
(μ s)
读存储器
创建文件
管道
TCP
0,28
23809
101
305
0,27
18,181
62
162
0,26
13,333
91
332
系统开

(μ s)
无系统调用
创建进程
现场切换
7
4500
36
5
3700
14
16
1200
13
由 LMBENCH测得的带宽、时延和系统开销
哈尔滨工业大学计算机科学与技术学院 11
?3.STREAM
?是一个简单的合成基准程序;
?由 SGl的 JohnMcCalpin提出。
?测量持续的存储器带宽 (以 MB/ s为
单位 )和相应的计算速率。
?下表中的向量 a,b和 c均是有 二百
万个元素 的数组,其中每个元素是
一个 8字节的字。
哈尔滨工业大学计算机科学与技术学院 12
哈尔滨工业大学计算机科学与技术学院 13
?McCalpin提出一个机器平衡指标,由
下式定义,
哈尔滨工业大学计算机科学与技术学院 14
?4.说明(如下表所示),
? 许多系统的机器平衡值随年份增长而
不断增加,意味着存储器带宽越来越
落后于处理器速度。
?IBM RS6000各种服务器是个例外,因
为 IBM公司对其中的存储器系统设计
总是给予足够重视。
? 其他公司也尝试改进存储器系统性能。
哈尔滨工业大学计算机科学与技术学院 15
哈尔滨工业大学计算机科学与技术学院 16
? 三、并行计算的基准程序
? 测试分布共享存储器机器
? 数值计算基准程序
? 斯坦福大学开发的 Splash和 Splash-2;
? 并行化编译程序系统和技术,
? 伊利诺斯大学开发的 Perfect基准程序
? 常用的 3个并行基准程序组,
?NPB,PARKBENCH和 STAP,它们代表了科
学计算中的主要应用组。
哈尔滨工业大学计算机科学与技术学院 17
? 1,NPB组
? 在并行计算机供应商、用户和研究人员
中,NPB已被广泛接受。
? NAS并行基准程序 (NASParallel
Benchmark,NPB)是由 NASA Ames
Resear Center为数值空气动力模拟计
划开发的,用来评估并行超级计算机的
性能。
? NPB模仿大型计流体动力学
(computational fluid dynamics,
CFD)应用中的计算和数据移动特征。
哈尔滨工业大学计算机科学与技术学院 18
?NPB组由 5个核心 (EP,MG,CG、
FT和 IS)和 3个模拟应用 (LU,SP
和 BT)程序组成。
?EP (Embarrassingly Parallel)
基准程序;
?能运行在任意个数的处理器而只需很
少通信。它能估计并行计算机可达到
的浮点性能的上限。
哈尔滨工业大学计算机科学与技术学院 19
? MG(MultiGridmethod,多栅格方法 )基
准程序
? 求解二维标量泊松 (Poisson)方程。要完
成具有高度结构化的短距离和远程通信。
? CG(Conjugate Gradient method,共
轭梯度方法 )基准程序
? 计算对称正定矩阵的最小本征值。它的
特点是进行非结构栅格计算,需要不规
则的远程通信。
哈尔滨工业大学计算机科学与技术学院 20
? FT基准程序
?使用基于 FFT的光谱方法求解三维
偏微分方程,也需要远程通信。
?IS(整数排序,Integer Sorting)
基准程序
?基于桶型排序的并行排序程序。它
需要很多全体交换通信。
哈尔滨工业大学计算机科学与技术学院 21
?三种模拟应用
? 三者通信不同
?BT(BlockTri-diagonal,块三对角 )
?LU(block lower triangular,块下
三角,block uppertriangular,块
上三角 ) ;
?SP(ScalarPenta-diagonal,标量五
对角 )基准程序
哈尔滨工业大学计算机科学与技术学院 22
?2.PARKBENCH
? PARKBENCH(并行核心和基准程序 )委员

? 在 1992年超级计算会议上由一些对并行计
算机基准程序测试感兴趣的人们创立的。
该组织的一个贡献是建立了一致的性能指
标和记号集。
? 目前的基准程序用于分布存储多计算

? 用 Fortran 77编码,并用 PVM或 MPI做消息
传递。正在开发基准程序的 Fortran 90和
HPF版本以及适用于共享存储体系结构的
基准程序。
哈尔滨工业大学计算机科学与技术学院 23
?该小组已提出 4类基准程序,
? 低层基准程序
? 核心基准程序
? 压缩应用基准程序
? 目前只包括并行光谱转换浅水建模应用以
及 3个 NPB模拟应用
? HPF编译器基准程序
? 是几个简单的合成应用,用来测量 HPF编
译器性能,侧重对显式并行 HPF构造的并
行实现的检测
哈尔滨工业大学计算机科学与技术学院 24
?3.并行 STAP组
? 空一时自适应处理 (Space-Time Adaptive
Processing)基准程序组是一套实时雷达
信号处理基准程序。
? 最初由 MIT的林肯实验室 (Lincoln
Laboratory)开发。 MIT的顺序 STAP近来已
在南加州大学被转换成并行 STAP,用来评
估各种 MPP。
? STAP基准程序是密集计算,要求在不到 1
秒时间内对 O(102-104)MB数据完成 O(1010-
1014)浮点操作。
哈尔滨工业大学计算机科学与技术学院 25
? STAP基准程序组由 5个程序组成,
?AdaptiveProcessingTestbed(APT,自适
应处理试验台 )
?High-Order Post— Doppler(HO— PD,高
阶后多普勒 )
?Beam Space PRI-Staggered
PostDoppler(BM— Stag)
?Element Space PRI-Staggered Post
Doppler(EL— Stag)
?General(GEN)
哈尔滨工业大学计算机科学与技术学院 26
?General(GEN)
?GEN程序由 4个独立分程序组成,
? 分别完成排序 (SORT)
? 快速傅里叶变换 (FFT)
? 向量乘 (VEC)以及线性代数 (LA)
? 它们代表了在雷达信号处理应用中经
常使用的核心子程序
哈尔滨工业大学计算机科学与技术学院 27
APT,
HO-PD,
BM,EL等
4个基准程
序的结构
哈尔滨工业大学计算机科学与技术学院 28
? APT,HO-PD,BM,EL等 4个基准程
序的结构说明,
① 全以 Doppler Processing(DP,多
普勒处理 )步开始。
② APT完成 Householder
Transform(HT,普通转换 ) ;
③ 它在以后的 beamforming(BF,射
束形成 )步,
?以抑制人为干扰台和杂乱回波;
哈尔滨工业大学计算机科学与技术学院 29
? 而在 HO— PD程序中,两个自适应射束形
成步被合成为一步。 BM— Stag程序和
EL— Stag程序与 HO— PD类似,但各自在
射束空间和元空间中使用交叉干扰训练
算法。
④ 以 target detection(TD,目标探测 )
步结束。
哈尔滨工业大学计算机科学与技术学院 30
?四、商业和 TPC基准程序
?商用的最为流行的基准程序组是
TPC基准程序,它由事务处理性能
委员会 (Transaction Processing
Performance Council,故名为
TPC)开发,
?这是一个非盈利组织,主要从事
事务处理和数据库基准程序的开
发。
哈尔滨工业大学计算机科学与技术学院 31
? TPC已发布了 4个基准程序。根据 1995
年 6月资料,TPC-A和 TPC-B已被废弃。
? TPC-C是数据记载基准程序,测量事务
处理系统的性能和价格/性能比。
? TPC-D则测量决策支持系统。
? TPC正开发 TPC-E(Enterprise,企业 )
的新基准程序,以量化支持适合于大
型商业企业计算环境的特定系统的能
力。
哈尔滨工业大学计算机科学与技术学院 32
? TPC-C是一个在线事务处理 (OLTP)基准
程序,用得最广。
?它模拟一个完整的大规模公司环境,
其中终端操作员对数据库执行事务操
作。公司管理 N个仓库,每个仓库供
应 10个销售区,每个区为 3000名顾客
服务。每个仓库有 10个终端,每个区
有一个。
?在任何时间,一个操作员可执行表中
的处理
哈尔滨工业大学计算机科学与技术学院 33
哈尔滨工业大学计算机科学与技术学院 34
?被测系统必须具有 ACID性质
?原子性 (atomicity);
?一致性 (consistency);
?隔离性 (isolation);
?持久性 (durability)。
哈尔滨工业大学计算机科学与技术学院 35
? 五,SPEC基准程序系列
?SPEC基准程序系列是由名为
?StandardPerformanceEvaluationCor
poration非盈利公司所开发的。
?SPEC以测量 CPU性能的基准程序作为
出发点,但已向客户机/服务器计算
I/ O子系统等方面扩展。
哈尔滨工业大学计算机科学与技术学院 36
? 目前 SPEC已公布如下的基准程序组,
? SPEC95
? 测量 CPU、存储器系统和编译器代码生
成性能。
?SPEC 95CPU基准程序从整体上测试 CPU
速度、高速缓存/存储器系统以及编译
器。它不计操作系统和 I/ 0操作时间。
?SPEC 95由 CINT 95(8个整数程序 )和
CFP95(10个浮点程序 )组成,两者均是
CPU密集应用。
哈尔滨工业大学计算机科学与技术学院 37
?SPEChpc 96
?测量运行工业型应用程序的高性能
计算系统的性能。
?SPEC web 96
?SFS
?为系统级文件服务器基准程序。
哈尔滨工业大学计算机科学与技术学院 38
?SDM
?为系统开发多任务基准程序,测量
一个系统如何处理一个有大量用户
发出典型的 Unix软件开发命令 (如
make,cp,grep及 spell等 )的环境。
?GPC
?图形性能特征描述基准程序,测量
图形学性能。
哈尔滨工业大学计算机科学与技术学院 39
?下表给出了 Digital Alpha
Station 500/ 500的 SPEC95结果
?该工作站使用 500MHz Alpha 21164
微处理器,8MB高速缓存以及 128MB
主存。
?指定系统的所有 SPEC95结果,均表
示成与参照机 SUN SPARC工作站 10
/ 40性能比较的比例。
哈尔滨工业大学计算机科学与技术学院 40
指标
速 度 吞 吐 率
95 _base95 _rate95 _rate base95
SPECint 15 12.6 135 113
SPECfp 20.4 18.3 183 165
Alpha Station 的 SPEC95性能
哈尔滨工业大学计算机科学与技术学院 41
?总结,
?探讨了几种常用的测试程序;