稠密矩阵运算 习题例题: 根据9.3.2节所讨论的矩阵-向量乘法,试证明:在p个处理器的超立方上,用SF选路方法进行矩阵-向量乘法,其并行运行时间约为。 试证明:在超立方上,并行分块矩阵算法和Cannon乘法的等效率函数约为;而Fox乘法的等效率函数为。 根据9.4.3节所讨论的Fox函数: 试写出Fox乘法的形式描述; 试分析Fox乘法的主要优点是什么。 算法9.7给出了n的平方个处理器的并行系统上用PRAM-CREW模型施行两个n*n矩阵相乘的算法。假定存储器的读写事件为,两个元素的乘-加时间为。试分析该算法的并行运行时间。  5、参照图9.14,算法9.8描述了m*k二维systolic阵列上实现*=的 矩阵乘法,它是采用流水线原理,通过在时间上延迟矩阵元素的办法来达到一对下标 合宜的矩阵元素适时相乘的目的。   试问:①为了确保与适时在相遇矩阵的第i行要比第i-1行(2≤i≤m)滞后多少时间单位?同样,B矩阵的第j列要比第j一1列(2≤j≤k)的滞后多少时间单位? ②当j=k时,a传送给吗?当i=m时.b传送给吗?