数据残差图分析原理;
关于变量X和Y的一元线性回归模型:
ε~N(0,σ2),
取定可控变量X的一组值,对Y做n次观察(试验),假定各次试验是相互独立的.记试验结果为Y1,Y2,…,Yn,则
满足回归假定:
设Y对应于的n个观测值为,记
,(i=1,2,…,n)
作为yi,(i=1,2,…,n)的估计值,其中分别为a和b的估计.
称
,
为残差.称
为标准化残差.
由于,i=1,2,…,n相互独立,并且~N(0,σ2),有
有95.45%的把握说,e*的值在(一2,2)区间内变动.
以e*为纵坐标,xi为横坐标,将数据(xi,e*),i=1,2,…,n绘在平面图内,所得图形称为标准化残差图,
σ是未知参数,可用
作为σ的估计,仍记
若数据点(xi,e*),i=1,2,…,n在(一2,2)区间内随机散布,则说明回归方程的拟合是良好的.反之,则说明方程对数据的拟合有问题.
例6.5.1 生产费用与产量拟合优度分析
随机抽取了某一类企业中的10个企业,调查了它们的产量和生产费用情况,取得数据如下表:
企业编号
1 2 3 4 5 6 7 8 9 10
产量(千个)X
40 42 48 55 65 79 88 100 120 140
生产费用(千元)Y
150 140 160 170 150 162 185 165 190 185
建立经验回归方程为
计算出标准化残差(见P170表7.9),绘制生产费用的标准化残差图(图7.11).图中标准化残差e*在横轴上下随机散布,且位于(一2,2)区间内,可以认为方程对数据的拟合是良好的.
关于变量X和Y的一元线性回归模型:
ε~N(0,σ2),
取定可控变量X的一组值,对Y做n次观察(试验),假定各次试验是相互独立的.记试验结果为Y1,Y2,…,Yn,则
满足回归假定:
设Y对应于的n个观测值为,记
,(i=1,2,…,n)
作为yi,(i=1,2,…,n)的估计值,其中分别为a和b的估计.
称
,
为残差.称
为标准化残差.
由于,i=1,2,…,n相互独立,并且~N(0,σ2),有
有95.45%的把握说,e*的值在(一2,2)区间内变动.
以e*为纵坐标,xi为横坐标,将数据(xi,e*),i=1,2,…,n绘在平面图内,所得图形称为标准化残差图,
σ是未知参数,可用
作为σ的估计,仍记
若数据点(xi,e*),i=1,2,…,n在(一2,2)区间内随机散布,则说明回归方程的拟合是良好的.反之,则说明方程对数据的拟合有问题.
例6.5.1 生产费用与产量拟合优度分析
随机抽取了某一类企业中的10个企业,调查了它们的产量和生产费用情况,取得数据如下表:
企业编号
1 2 3 4 5 6 7 8 9 10
产量(千个)X
40 42 48 55 65 79 88 100 120 140
生产费用(千元)Y
150 140 160 170 150 162 185 165 190 185
建立经验回归方程为
计算出标准化残差(见P170表7.9),绘制生产费用的标准化残差图(图7.11).图中标准化残差e*在横轴上下随机散布,且位于(一2,2)区间内,可以认为方程对数据的拟合是良好的.