第八章 方差分析和回归分析 §8.1 方差分析 教学目的: 1.了解单因素实验的方差分析. 2.了解双因素无重复实验的方差分析及双因素重复实验 的方差分析. 二、教学重点:单因素实验的方差分析. 三、教学难点:双因素重复实验的方差分析. 四、教学过程: (一)单因素的方差分析 单因素实验:为了考察某个因素A对所研究的随机变量X的影响是否显著,实验时让其他因素保持不变,仅让因素A改变. 水平:因素A在实验中所取的不同状态. 用 A,A,…………,A. 方差分析:检验同方差的若干正态母体均值是否相等的一种统计分析方法., 设在A水平下的实验结果Y~~N(u,) i=1,2,…,r. (分组总体) 每组进行七次实验,获得七次实验结果, .j=1,2,…,t, (组内观测值) 随机误差,与的差. ~~ N(0,). 的数据结构构成形式 = i=1,2,…,r: j=1,2,…,t. 检验:  引入 ① 一般平均 =. ②因素A在第i 个水平A下的效应 ==. 则. 此时 , 因此要检验的原假设为 :  各组内样本均值 == 。 总的均值 == (其中n=rt) 统计量:总的偏差平方和  = 由于 = =+ = 其中 ①称组内平方和(误差平方的偏差和)反映了实验过程中各种随机因素所引起的随机误差。(偶然误差)  = ②:称为组间平方和,反映了各组样本之间的差异程度,即由于因素A的不同水平所引起的系统误差。  = = = = =r(t-1) =(n-r) = =+ =+- =+ 若为真 ,则及均为的无偏估计。 故, =的比值不能太大,否则不真。 由于一切~ ~ 且相互独立 。 由于一切  根分布可加性  且 与相互独立 故, 。 赫伦定理:设x为n个独立N(0,1)的随机变量,Q=为x变量,若Q=Q Q++Q其中Q是某些正态变量的平方和。这些变量分别是 x,xx的线性组合,其自由度为f,则若Q相互独立,且为X()变量 () 证: 必要性: 若QQ,Q相互独立 且Q~x  则由-分布的可加性知Q=Q~x() 又有Q~x 从而 n= 充分性: 设为正态变量  且Q 由假设知 在中必可选出个,而其余的可由这个线性表示,不妨设,可由线性表示,代入Q得:Q为的一个非负二次型 化成标准二次型Q=  是的线性组合,由于是x的线性组合。 (二)双因子方差分析 设在某实验中,二因子在变动,因子取个不同水平因子取S不同水平 在水平组合下的实验结果独立的服从 引入:       则  一.若 无交互的方差分析模型  检验假设    2. 构造统计量 ~ ~ 给出显著性水平,查分布表,确定拒绝域 计算值 = 其中= S== S== S=S-S-S 其中: S 是由随机因素所引起的偶然误差 S是由因素A的不同水平所引起的系统误差 S是由因素B的不同水平所引起的系统误差 理论依据 引理1 证 S = S+S+S S==++  (其中交叉项乘积的代数和为零) 在H,H为真时。 (2) S~ S~ 由线形关系式=0 S~ 由线形关系式=0 S中有r+s个线形关系式   且只有r+s-1个相互独立的 其自由度rs-(+s-1)=(r-1)(s-1) 例P 二.交互作用下的二因子方差分析。 =  (,其中n=rst) 与 与 与有类似前面的记法    S=  =(+(+() = ++st +rt =++ 理论依据: (r-1)   S~X(rst-1) 由于rst-1=rs(t-1)+(r-1)(t-1)+r-1+s-1 S~X(rs(t-1)) P例8.3 作业.P8.2 §8.2线性回归分析的数学模型 一、教学目的 理解回归分析的基本的概念,掌握一元线性回归方程。 掌握线性相关性的显著性检验 会利用一元线性回归方程进行预测 了解一些可线性化的非线性回归及多项式回归问题 了解二元线性回归分析 二、教学重点: 1.线性回归分析及其常用方法——最小二乘法。 2.二元线性回归分析。 三、教学难点: 1.运用相关数学软件计算线回归分析中有关统计量的观测值的方法 2.决线性回归分析问题 引入 1.现实世界中变量之间的关系可以分成两大类 一类:确定性的关系:如U=IR,S=R等 二类:非确定性的关系:如血压与年龄 (不能用一个确定的函数关系式表达出来) 随机变量(至少其中一个是随机变量)之间的关系 回归分析: 1.寻找这类不确定的变量间的数学关系式,并进行统计推的一种方法。 (最简单的关系式是线性回归) 2设x是可以精确测量或控制的非随机变量,y是s随机变量。当X取x时,Y的概率分析与x有关,则称Y与X之间有相关关系。 当X取x时,y的概率分析与 X有关,则称 Y X 之间有相关关系。 当X=x时 E(y)= 作为y的估计值 即 =称作y关于x的回归方程 3. 线性回归分析:  即试验结果y的一部分由x的线性函数引起 ,另一部分有由随机因素引起  进行若干次独立试验,得到的结果为 由  4.多元回归分析  n组观测植   解决问题 根据样本估计未知参数 对此数量关系式的可信度进行统计检验。 检验各变量 分别对指标是否有显著性影响。 二 参数估计  Q()=min() = 由最小二乘法原理 令 j=1,2,……p 即:正规方程组  1.用矩阵形式表示: 为结构矩阵 为正规系数矩阵。 为常数项矩阵,此时 最小二乘估。 对应 的预测值。=+++ 2.估计 (1)残差 实测值与回归值的差。 (2)残差向量 =-=-=[] 残差平方和(剩余平方和) = = =-+- =- = 定理8.2 =(n-p-1) =E=E=E= E=E=E( = ==0 E=D=D =D = E= = == Cor1: 为 的无偏估计。 例1. 求一元线性回归  中参数 ,的最小二乘估计及 的无偏估计。 解: 令   正规方程组  即  解出  其中      例8.6 求 P元中化回归模型:   中参数 的最小二乘估计与的无偏估计。 其中 解:先解出结构矩阵     其中   正规方程组    即