第八章 方差分析和回归分析
§8.1 方差分析
教学目的:
1.了解单因素实验的方差分析.
2.了解双因素无重复实验的方差分析及双因素重复实验
的方差分析.
二、教学重点:单因素实验的方差分析.
三、教学难点:双因素重复实验的方差分析.
四、教学过程:
(一)单因素的方差分析
单因素实验:为了考察某个因素A对所研究的随机变量X的影响是否显著,实验时让其他因素保持不变,仅让因素A改变.
水平:因素A在实验中所取的不同状态.
用 A,A,…………,A.
方差分析:检验同方差的若干正态母体均值是否相等的一种统计分析方法.,
设在A水平下的实验结果Y~~N(u,) i=1,2,…,r. (分组总体)
每组进行七次实验,获得七次实验结果, .j=1,2,…,t, (组内观测值)
随机误差,与的差. ~~ N(0,). 的数据结构构成形式 = i=1,2,…,r: j=1,2,…,t.
检验:
引入 ① 一般平均 =.
②因素A在第i 个水平A下的效应 ==. 则.
此时 , 因此要检验的原假设为
:
各组内样本均值 == 。
总的均值 == (其中n=rt)
统计量:总的偏差平方和
=
由于
=
=+
=
其中
①称组内平方和(误差平方的偏差和)反映了实验过程中各种随机因素所引起的随机误差。(偶然误差)
=
②:称为组间平方和,反映了各组样本之间的差异程度,即由于因素A的不同水平所引起的系统误差。
=
=
=
=
=r(t-1)
=(n-r)
=
=+
=+-
=+
若为真 ,则及均为的无偏估计。
故, =的比值不能太大,否则不真。
由于一切~ ~ 且相互独立
。
由于一切 根分布可加性
且 与相互独立
故, 。
赫伦定理:设x为n个独立N(0,1)的随机变量,Q=为x变量,若Q=Q Q++Q其中Q是某些正态变量的平方和。这些变量分别是 x,xx的线性组合,其自由度为f,则若Q相互独立,且为X()变量 ()
证: 必要性:
若QQ,Q相互独立 且Q~x 则由-分布的可加性知Q=Q~x() 又有Q~x 从而 n=
充分性:
设为正态变量 且Q
由假设知 在中必可选出个,而其余的可由这个线性表示,不妨设,可由线性表示,代入Q得:Q为的一个非负二次型 化成标准二次型Q= 是的线性组合,由于是x的线性组合。
(二)双因子方差分析
设在某实验中,二因子在变动,因子取个不同水平因子取S不同水平 在水平组合下的实验结果独立的服从
引入:
则
一.若 无交互的方差分析模型
检验假设
2. 构造统计量 ~
~
给出显著性水平,查分布表,确定拒绝域
计算值
= 其中=
S==
S==
S=S-S-S
其中: S 是由随机因素所引起的偶然误差
S是由因素A的不同水平所引起的系统误差
S是由因素B的不同水平所引起的系统误差
理论依据
引理1 证 S = S+S+S
S==++
(其中交叉项乘积的代数和为零)
在H,H为真时。
(2) S~
S~ 由线形关系式=0
S~ 由线形关系式=0
S中有r+s个线形关系式
且只有r+s-1个相互独立的
其自由度rs-(+s-1)=(r-1)(s-1)
例P
二.交互作用下的二因子方差分析。
= (,其中n=rst)
与 与 与有类似前面的记法
S=
=(+(+()
= ++st
+rt
=++
理论依据: (r-1)
S~X(rst-1)
由于rst-1=rs(t-1)+(r-1)(t-1)+r-1+s-1
S~X(rs(t-1))
P例8.3
作业.P8.2
§8.2线性回归分析的数学模型
一、教学目的
理解回归分析的基本的概念,掌握一元线性回归方程。
掌握线性相关性的显著性检验
会利用一元线性回归方程进行预测
了解一些可线性化的非线性回归及多项式回归问题
了解二元线性回归分析
二、教学重点:
1.线性回归分析及其常用方法——最小二乘法。
2.二元线性回归分析。
三、教学难点:
1.运用相关数学软件计算线回归分析中有关统计量的观测值的方法
2.决线性回归分析问题
引入 1.现实世界中变量之间的关系可以分成两大类
一类:确定性的关系:如U=IR,S=R等
二类:非确定性的关系:如血压与年龄
(不能用一个确定的函数关系式表达出来)
随机变量(至少其中一个是随机变量)之间的关系
回归分析:
1.寻找这类不确定的变量间的数学关系式,并进行统计推的一种方法。
(最简单的关系式是线性回归)
2设x是可以精确测量或控制的非随机变量,y是s随机变量。当X取x时,Y的概率分析与x有关,则称Y与X之间有相关关系。
当X取x时,y的概率分析与 X有关,则称 Y
X 之间有相关关系。
当X=x时
E(y)= 作为y的估计值
即 =称作y关于x的回归方程
3. 线性回归分析:
即试验结果y的一部分由x的线性函数引起 ,另一部分有由随机因素引起
进行若干次独立试验,得到的结果为
由
4.多元回归分析
n组观测植
解决问题
根据样本估计未知参数
对此数量关系式的可信度进行统计检验。
检验各变量 分别对指标是否有显著性影响。
二 参数估计
Q()=min()
=
由最小二乘法原理
令 j=1,2,……p
即:正规方程组
1.用矩阵形式表示:
为结构矩阵 为正规系数矩阵。 为常数项矩阵,此时 最小二乘估。
对应 的预测值。=+++
2.估计
(1)残差 实测值与回归值的差。
(2)残差向量 =-=-=[]
残差平方和(剩余平方和) =
=
=-+-
=-
=
定理8.2 =(n-p-1)
=E=E=E=
E=E=E(
=
==0
E=D=D
=D
=
E=
=
==
Cor1: 为 的无偏估计。
例1. 求一元线性回归 中参数 ,的最小二乘估计及 的无偏估计。
解:
令
正规方程组 即
解出 其中
例8.6 求 P元中化回归模型:
中参数 的最小二乘估计与的无偏估计。
其中
解:先解出结构矩阵
其中
正规方程组
即