第十一章 相关与回归分析一、填空题
1,社会经济现象间的关系分为两种类型:一种是,另一种是 。
2,在相关关系中,当给定一个X值时,Y值不是唯一确定的,而可能同时出现几个不同的数值并在一定范围内围绕其 上下波动。
3,按相关的程度可分为, 和 。
4,相关系数的取值在 之间,其绝对值在 之间属于中度相关。
5,回归分析就是根据变量X与Y之间的关系,建立两个变量之间的直线关系近似表达式进行 和 的。
6,直线回归中总变差等于 和 之和。
7,回归系数b与相关系数r的符号应,当b大于0时,表明两变量是 。
8,在相关分析中,要求两个变量都是随机的,而在回归分析中,要求自变量是,因变量是 。
9,设变量x与y之间的相关系数r = - 0.92,这说明这两个变量之间存在着 相关。
10,在线性回归分析中,只涉及一个自变量的回归称为 ;涉及多个自变量的回归称为 。
二,判断题
1,如果变量x与y之间的相关系数r = 0,表明这两个变量之间不存在任何相关关系。( )
2,设两个变量的一元线性回归方程为= -10 + 0.5x,由此可以判定这两个变量之间存在着负相关关系。( )
3,在其他条件不变的情况下,可决系数越大,估计标准误差也越大,回归直线的拟合程度就越低。( )
4,如果回归系数为零,则相关系数必为零。( )
5,对相关系数进行显著性检验,即检验总体相关系数ρ是否为零。若ρ=0表示变量X与Y间存在线性相关关系。( )
6,回归变差反映的是由于x与y之间的线性关系而引起的y的变差。( )
7,相关系数r与可决系数的取值范围是一致的。( )
8,相关关系侧重于考察变量之间的关系密切程度,回归分析则侧重于考察变量之间的数量变化规律。( )
9,我国的GDP与印度的人口之间的相关系数大于0.8,因此两者具有高度正相关关系。( )
10,拟合回归直线的目的在于用直线上的点来代表所有的相关点。( )
三,单项选择题
1,变量x与y之间的负相关是指( )
A,x数值增大时y也随之增大
B,x数值减少时y也随之减少
C,x数值增大(或减少)时y随之减少(或增大)
D,y的取值几乎不受x取值的影响
2,下列各直线回归方程中,哪一个是不正确的( )
A. = 15+7X,r=0.92 B, = 20-5X,r=0.85
C, = -10+2X,r=0.78 D,= 5-3X,r=-0.69
3,在回归直线= a+bx中,回归系数b表示( )
A. 当x=0时y的期望值
B. x变动一个单位时y的变动总额
C. y变动一个单位时x的平均变动量
D. x变动一个单位时y的平均变动量
4,说明回归直线拟合程度的统计量主要是( )
A.相关系数 B.回归系数 C.可决系数 D.估计标准误差
5,若已知是的两倍,是的1.2倍,则相关系数r = ( )
A. B, C,0.92 D,0.65
6,计算估计标准误差的依据是因变量的( )
A.数列 B.总变差 C.回归变差 D.剩余变差
7,如果变量x与y之间的相关系数为1,则说明两个变量之间是( )
A.完全不相关 B.高度相关关系
C.完全相关关系 D.中度相关关系
8,各实际观测值与回归值的离差平方和称为( )
A.总变差 B.剩余变差 C.回归变差 D.可决系数
9,设某种产品产量为1000件时,其生产成本为30000元,其中固定成本为6000元。则总生产成本对产量的一元线性回归方程为( )
A,Y=6+0.24x B,Y=6000+24x C,Y=24000+6x D,Y=24+6000x
10,在直线回归方程=a+bx中,若回归系数b=0,则表示( )
A,y对x的影响是显著的 B,y对x的影响是不显著的
C,x对y的影响是显著的 D,x对y的影响是不显著的
四、多项选择题
1,设单位产品成本(元)对产量(千件)的一元线性回归方程为Y=85-5.6x,这意味着( )
A,单位成本与产量之间存在着负相关 B.单位成本与产量之间是正相关
C,产量为1000件时单位成本为79.4元 D.产量每增加1千件单位成本平均增加5.6元
E.产量每增加1千件单位成本平均减少5.6元
2,如果两个变量之间的线性相关程度很高,则其相关系数应接近于( )
A,0.5 B,-0.5 C,0 D.1 E.-1
3,变量分析中的回归变差是指( )
A,实际值与平均值的离差平方和 B,估计值与平均值的离差平方和
C,受自变量变动影响所引起的变差 D,受随机变量变动影响所产生的误差
E.总变差与残差之差
4,估计标准误差主要用于( )
A. 区间估计 B.说明回归直线的代表性 C.说明回归方程拟合优度
D,测定变量间关系的密切程度 E.说明估计值对回归直线的离散程度
5,如果变量x与y之间没有线性相关关系,则( )
A,相关系数为0 B,回归系数为0 C.可决系数为0
D,估计标准误差为0 E,估计标准误差为1
五、名词解释
1,相关关系与相关系数
2,回归系数与回归分析
3,估计标准误差
4,剩余变差
5,可决系数
六,计算题
1. 对10户居民家庭的月可支配收入和消费支出进行调查,得到资料如下:(单位:百元)
编 号
1
2
3
4
5
6
7
8
9
10
消费支出
20
15
40
30
42
60
65
70
53
78
可支配收入
25
18
60
45
62
88
92
99
75
98
要求:(1)画出相关图并判断消费支出与可支配收入之间的相关方向。
(2)计算消费支出与可支配收入的相关系数并说明其相关程度。
2. 某公司8个所属企业的产品销售资料如下:
企业编号
产品销售额(万元)
销售利润(万元)
1
2
3
4
5
6
7
8
170
220
390
430
480
650
850
1000
8.1
12.5
18.0
22.0
26.5
40.0
64.0
69.0
要求:(1)计算相关系数,测定产品销售额和利润之间的相关方向和相关程度;
(2)确定自变量和因变量,并求出直线回归方程;
(3)计算估计标准误差;
(4)根据回归方程,指出当销售额每增加1万元,利润额平均增加多少?
(5)在95%的概率保证下,当销售额为1200万元时利润额的置信区间。
3.对某一资料进行一元线性回归,已知样本容量为20,因变量的估计值与其平均数的离差平方和为585,因变量的方差为35,试求:
(1) 变量间的相关指数R;
(2) 该方程的估计标准误差。
4.已知
试求:(1)相关系数r; (2)回归系数b; (3)估计标准误差。
5.设有资料如下表所示:
两位评酒员对10种品牌白酒的主观排序白酒种类
1
2
3
4
5
6
7
8
9
10
甲的排序
7
1
5
6
8
9
4
3
10
2
乙的排序
6
3
2
4
9
10
8
5
7
1
试问两位评酒员的评审顺序是否具有一定的相关?(按5%的显著水平检验)
1,社会经济现象间的关系分为两种类型:一种是,另一种是 。
2,在相关关系中,当给定一个X值时,Y值不是唯一确定的,而可能同时出现几个不同的数值并在一定范围内围绕其 上下波动。
3,按相关的程度可分为, 和 。
4,相关系数的取值在 之间,其绝对值在 之间属于中度相关。
5,回归分析就是根据变量X与Y之间的关系,建立两个变量之间的直线关系近似表达式进行 和 的。
6,直线回归中总变差等于 和 之和。
7,回归系数b与相关系数r的符号应,当b大于0时,表明两变量是 。
8,在相关分析中,要求两个变量都是随机的,而在回归分析中,要求自变量是,因变量是 。
9,设变量x与y之间的相关系数r = - 0.92,这说明这两个变量之间存在着 相关。
10,在线性回归分析中,只涉及一个自变量的回归称为 ;涉及多个自变量的回归称为 。
二,判断题
1,如果变量x与y之间的相关系数r = 0,表明这两个变量之间不存在任何相关关系。( )
2,设两个变量的一元线性回归方程为= -10 + 0.5x,由此可以判定这两个变量之间存在着负相关关系。( )
3,在其他条件不变的情况下,可决系数越大,估计标准误差也越大,回归直线的拟合程度就越低。( )
4,如果回归系数为零,则相关系数必为零。( )
5,对相关系数进行显著性检验,即检验总体相关系数ρ是否为零。若ρ=0表示变量X与Y间存在线性相关关系。( )
6,回归变差反映的是由于x与y之间的线性关系而引起的y的变差。( )
7,相关系数r与可决系数的取值范围是一致的。( )
8,相关关系侧重于考察变量之间的关系密切程度,回归分析则侧重于考察变量之间的数量变化规律。( )
9,我国的GDP与印度的人口之间的相关系数大于0.8,因此两者具有高度正相关关系。( )
10,拟合回归直线的目的在于用直线上的点来代表所有的相关点。( )
三,单项选择题
1,变量x与y之间的负相关是指( )
A,x数值增大时y也随之增大
B,x数值减少时y也随之减少
C,x数值增大(或减少)时y随之减少(或增大)
D,y的取值几乎不受x取值的影响
2,下列各直线回归方程中,哪一个是不正确的( )
A. = 15+7X,r=0.92 B, = 20-5X,r=0.85
C, = -10+2X,r=0.78 D,= 5-3X,r=-0.69
3,在回归直线= a+bx中,回归系数b表示( )
A. 当x=0时y的期望值
B. x变动一个单位时y的变动总额
C. y变动一个单位时x的平均变动量
D. x变动一个单位时y的平均变动量
4,说明回归直线拟合程度的统计量主要是( )
A.相关系数 B.回归系数 C.可决系数 D.估计标准误差
5,若已知是的两倍,是的1.2倍,则相关系数r = ( )
A. B, C,0.92 D,0.65
6,计算估计标准误差的依据是因变量的( )
A.数列 B.总变差 C.回归变差 D.剩余变差
7,如果变量x与y之间的相关系数为1,则说明两个变量之间是( )
A.完全不相关 B.高度相关关系
C.完全相关关系 D.中度相关关系
8,各实际观测值与回归值的离差平方和称为( )
A.总变差 B.剩余变差 C.回归变差 D.可决系数
9,设某种产品产量为1000件时,其生产成本为30000元,其中固定成本为6000元。则总生产成本对产量的一元线性回归方程为( )
A,Y=6+0.24x B,Y=6000+24x C,Y=24000+6x D,Y=24+6000x
10,在直线回归方程=a+bx中,若回归系数b=0,则表示( )
A,y对x的影响是显著的 B,y对x的影响是不显著的
C,x对y的影响是显著的 D,x对y的影响是不显著的
四、多项选择题
1,设单位产品成本(元)对产量(千件)的一元线性回归方程为Y=85-5.6x,这意味着( )
A,单位成本与产量之间存在着负相关 B.单位成本与产量之间是正相关
C,产量为1000件时单位成本为79.4元 D.产量每增加1千件单位成本平均增加5.6元
E.产量每增加1千件单位成本平均减少5.6元
2,如果两个变量之间的线性相关程度很高,则其相关系数应接近于( )
A,0.5 B,-0.5 C,0 D.1 E.-1
3,变量分析中的回归变差是指( )
A,实际值与平均值的离差平方和 B,估计值与平均值的离差平方和
C,受自变量变动影响所引起的变差 D,受随机变量变动影响所产生的误差
E.总变差与残差之差
4,估计标准误差主要用于( )
A. 区间估计 B.说明回归直线的代表性 C.说明回归方程拟合优度
D,测定变量间关系的密切程度 E.说明估计值对回归直线的离散程度
5,如果变量x与y之间没有线性相关关系,则( )
A,相关系数为0 B,回归系数为0 C.可决系数为0
D,估计标准误差为0 E,估计标准误差为1
五、名词解释
1,相关关系与相关系数
2,回归系数与回归分析
3,估计标准误差
4,剩余变差
5,可决系数
六,计算题
1. 对10户居民家庭的月可支配收入和消费支出进行调查,得到资料如下:(单位:百元)
编 号
1
2
3
4
5
6
7
8
9
10
消费支出
20
15
40
30
42
60
65
70
53
78
可支配收入
25
18
60
45
62
88
92
99
75
98
要求:(1)画出相关图并判断消费支出与可支配收入之间的相关方向。
(2)计算消费支出与可支配收入的相关系数并说明其相关程度。
2. 某公司8个所属企业的产品销售资料如下:
企业编号
产品销售额(万元)
销售利润(万元)
1
2
3
4
5
6
7
8
170
220
390
430
480
650
850
1000
8.1
12.5
18.0
22.0
26.5
40.0
64.0
69.0
要求:(1)计算相关系数,测定产品销售额和利润之间的相关方向和相关程度;
(2)确定自变量和因变量,并求出直线回归方程;
(3)计算估计标准误差;
(4)根据回归方程,指出当销售额每增加1万元,利润额平均增加多少?
(5)在95%的概率保证下,当销售额为1200万元时利润额的置信区间。
3.对某一资料进行一元线性回归,已知样本容量为20,因变量的估计值与其平均数的离差平方和为585,因变量的方差为35,试求:
(1) 变量间的相关指数R;
(2) 该方程的估计标准误差。
4.已知
试求:(1)相关系数r; (2)回归系数b; (3)估计标准误差。
5.设有资料如下表所示:
两位评酒员对10种品牌白酒的主观排序白酒种类
1
2
3
4
5
6
7
8
9
10
甲的排序
7
1
5
6
8
9
4
3
10
2
乙的排序
6
3
2
4
9
10
8
5
7
1
试问两位评酒员的评审顺序是否具有一定的相关?(按5%的显著水平检验)