第九章习题
2.某医师测得10名正常成年男性的血浆清蛋白含量(g/l)及其血红蛋白含量(g/l)数据如下。请对这两项指标作相关分析并计算其相关系数的95%可信区间。
10名正常成年男性的血浆清蛋白含量(g/l)及其血红蛋白含量(g/l)
学生编号
1
2
3
4
5
6
7
8
9
10
胸围X
35.5
36.5
38.5
37.5
36.5
35.4
34.5
34.2
34.6
33.5
肺活量Y
119.5
120.5
127.5
126.5
120.5
118.5
110.5
109.2
108.5
105.3
散点图:
2)计算:
(1) ΣX = 356.7, ΣX 2 = 12745.71, n = 10,
ΣY = 1166.5, ΣY 2 = 136616.73, ΣXY = 41714.69;
(2) lXX = 12745.71 - 356.72 / 10 = 22.221,
lYY = 136616.73 - 1166.52 / 10 = 544.505,
lXY = 41714.69 - 356.7 × 1166.5 / 10 = 105.635;
(3) r = 105.635 / √ 22.221 × 544.505 = 0.960340。
3) 假设检验:
H0: 正常成年男性的血浆清蛋白含量与血红蛋白含量间无直线相关关系, ρ = 0;
H1: 正常成年男性的血浆清蛋白含量与血红蛋白含量间有直线相关关系, ρ ≠ 0。
α = 0.05。
Sr = √
1 – 0.9603402
= 0.09858165。
10 - 2
t =
0.960340
= 9.7416, = 10 – 2 = 8。
0.098582
查表得 t > t 0.01,8, P < 0.01。
在α = 0.05的水准处拒绝H0,可认为正常成年男性的血浆清蛋白含量及其血红蛋白含量之间有正相关关系。
4)作相关系数ρ的95%的可信区间
z = tanh0.960340 = 1.950267
1.950267 1.96 / √ 10 – 3 = ( 1.209457 ~ 2.691078 ) => ( 0.8365 ~ 0.9908 )。
∴ ρ的95%可信区间为( 0.8365 ~ 0.9908 ) 。
3. 两名放射科医师对13张肺部x片各自作出评定结果,评定方法是将x片按病情严重程度给出等级。问他们的等级评定结果是否相关。
两名放射科医师对13张肺部x片的评定结果
编号
甲医师
乙医师
d
结果
秩
结果
秩
1
+
5.5
2.5
3
2
++
9.5
++
8
1.5
3
-
2
+
4.5
-2.5
4
+
5.5
+
4.5
1
5
-
2
-
1
1
6
+
5.5
++
8
-2.5
7
++
9.5
+++
12
-2.5
8
+++
12.5
++
8
4.5
9
++
9.5
+++
12
-2.5
10
+++
12.5
+++
12
0.5
11
-
2
2.5
-0.5
12
++
9.5
++
8
1.5
13
+
5.5
++
8
-2.5
Σd 2 = 67.5 ,
rs = 1 -
6 × 67.5
= 0.814560 , n = 13。
13 × ( 132 – 1 )
校正: (用秩作为原始数据,用积矩相关法计算)
rs′ = 0.800592 , n = 13 ;
或代入公式9 – 27:
TX = [ ( 33 – 3 ) + ( 43 – 4 ) = ( 43 – 4 ) + ( 23 – 2 ) ] / 6 = 12.5,
TY = [ ( 23 – 2 ) + ( 23 – 2 ) + ( 53 – 5 ) + ( 33 – 3 ) ] / 6 = 13;
rs ′ =
( 133 – 13 ) / 6 – ( 12.5 + 13 ) - 67.5
= 0.800592。
√( 133 – 13 ) / 6 - 2×12.5 × √( 133 – 13 ) / 6 - 2×13
0.791 < rs′= 0.800592 < 0.824, 0.002 < P < 0.001。
在α = 0.05的水准处拒绝H0,可认为两名放射科医师对13张肺部x片的等级评定结果有相关。
5.在一项科研协作课题中,两个地区分别测定了不同人群中25岁到34岁健康女性的三头肌皮褶厚度X(cm)和大腿围长Y(cm)数据如下表所示。求出两地各自Y对X的回归方程并比较其斜率与回归线高度。
两个地区健康女性的三头肌皮褶厚度X(cm) 和大腿围长Y(cm)
甲地区
乙地区
三头肌皮褶厚度X
大腿围长Y
三头肌皮褶厚度X
大腿围长Y
1.95
42.10
2.46
47.30
2.47
48.80
2.45
43.20
3.07
50.90
2.78
51.70
2.98
53.30
2.23
46.20
1.91
41.20
2.36
45.40
2.56
52.90
2.74
45.80
3.14
57.50
2.27
42.20
2.79
51.10
2.37
46.40
2.21
48.90
2.05
41.90
2.55
52.50
1.77
40.00
3.11
55.60
2.72
48.00
3.04
55.70
2.43
48.30
1.87
45.50
2.44
44.50
1.97
43.20
2.56
48.10
1.46
41.70
1.99
43.90
2.95
53.40
2.11
45.80
2.77
54.30
2.62
47.30
3.02
57.60
2.04
42.00
2.27
48.20
2.24
47.80
2.52
50.00
2.18
47.60
Σ?
50.61
1004.40
46.81
913.40
Σ(?)2
132.8629
50956.60
110.9565
41866.56
ΣXY
2587.529
2148.133
lXX
4.794295
1.397695
lYY
515.632
151.582
lXY
45.9848
10.3203
a
25.9960
28.3882
b
9.5728
7.3838
r
0.9231
0.7090
P
< 0.01
< 0.01
l回归
439.34148128
76.203028621
l残差
76.29051872
75.378971379
散点图:(见下页)
计算:(见表)
3) 假设检验:H0: ρ = 0, H1: ρ ≠ 0, α = 0.05 。
查r界值表, r0.01,18 = 0.561 ,在α = 0.05的水准处拒绝H0,可认为r1, r2都有意
义,两地区三头肌皮褶厚度X与大腿围长Y都存在正相关关系。
∵ tr与tb是等价的,∴ b1、b2都有意义,两回归方程都存在。
两回归方程分别为:
?1 = 25.9960 + 9.5728X1
?2 = 28.3882 + 7.3838X2
4) 两回归系数的比较:
t检验:H0: β1 = β2, H1: β1 ≠ β2, α = 0.05 。
Sb1-b2 = √
76.290519 + 75.378971
) × (
1
+
1
) = 1.973078679,
20 – 2 + 20 - 2
4.794295
1.397695
t =
9.5725 – 7.3838
= 1.1094, ν = 20 + 20 – 4 = 36。
1.9731
t < t 0.05,36, P > 0.05, 按α = 0.05水准不拒绝H0,两回归系数间差别无统计学意义。
《或作方差分析》
⑵ 方差分析:H0: β1 = β2, H1: β1 ≠ β2, α = 0.05 。
SS公共 = lYiYi – (l XiYi )2 / l XiXi
= ( 515.632 + 151.582 ) – ( 45.8948 + 10.3203 )2 / ( 4.794395 + 1.397695 )
= 156.8550576,
ν公共 = n1 + n2 – 3 = 20 + 20 – 3 = 37。
SS组内 = SS残1 + SS残2 = 76.290519 + 75.378971 = 151.669490。
ν组内 = n1 + n2 – 4 = 20 + 20 – 4 = 36。
列方差分析表:
方差分析表
来源
SS
MS
F
P
公共
156.8550
37
系数间
5.1856
1
5.1856
1.2308
> 0.05
组内
151.6695
36
4.2130
按α = 0.05水准不拒绝H0,可认为两回归系数间差别无统计意义。
计算公共系数bC :
bC =
45.8948 + 10.3203
= 9.079。
4.794295 + 1.397695
5) 两回归线高度的比较(略)。