第8章数据处理典型例题与综合练习一、典型例题
1.重要特征数例1设一组数据为78.2;88.2;79.3;80.5;83.4;81.2;76.3;86.5
求这组数据的(1)均值;(2)中位数;(3) 极差;(4) 方差及标准差;(5)变异系数,
解:将数据由小到大顺序排列为
76.3;78.2;79.3;80.5;81.2;83.4;86.5;88.2
(1)均值(76.3+78.2+79.3+80.5+81.2+83.4+86.5+88.2)
×653.6?81.7
(2)中位数共有8个数据,中间两个数是80.5和81.2,故中位数? ?(80.5+81.2) =80.85
(3)极差最大数是88.2,最小数是76.3,故极差?88.2-76.3?11.9
(4)方差?[(76.3-81.7)2+(78.2-81.7)2+┅+(88.2-81.7)2]×117.04=14.63
标准差??3.82
(5)变异系数
例2某公司制定下一年度计划时,由A,B,C,D,E五人预测下年度的销售量(单位:吨),分别为1300;1250;1 200;1230;1280
如果考虑到每人在公司的地位和作用,以及不同的业务水平,分别给予不同的权重,若A,B的权各为30%,C,D的权各为10%,E的权为20%,求下年度销售量的预测值及其方差.
解:根据加权平均数的计算公式有
?1300×30%+1250×30%+1200×10%+1230×10%+1280×20%?1264
即下年度销售量的预测值是1264吨.
方差(1300-1264)2×30%+(1250-1264)2×30%+┅+(1280-1264)2×20%
1024
标准差?
二、直方图例1 某项试验测得100个数据如下
0.253
0.222
0.267
0.278
0.269
0.315
0.235
0.295
0.238
0.275
0.289
0.265
0.248
0.256
0.295
0.259
0.272
0.281
0.261
0.305
0.251
0.239
0.278
0.251
0.280
0.263
0.257
0.278
0.246
0.285
0.254
0.249
0.302
0.250
0.271
0.260
0.258
0.272
0.253
0.284
0.255
0.290
0.271
0.259
0.257
0.273
0.246
0.233
0.249
0.270
0.266
0.279
0.242
0.220
0.258
0.271
0.257
0.273
0.274
0.244
0.288
0.259
0.270
0.241
0.273
0.296
0.248
0.244
0.300
0.254
0.277
0.244
0.268
0.261
0.253
0.282
0.282
0.256
0.283
0.263
0.252
0.281
0.236
0.230
0.258
0.255
0.286
0.260
0.278
0.272
0.248
0.279
0.297
0.270
0.213
0.261
0.231
0.264
0.273
0.296
(1)试列出这100个数据的频数分布表;
(2)作出频数直方图;
(3)作出频率直方图,并描绘出它的频率密度曲线;
(4)根据频数表,求出这100个数据的均值、方差、标准差.
解:(1)作频数分布表
①确定范围找出100个数据中的最大值和最小值,分别是0.315和0.213.取=0.210(<0.213),=0.320(>0.315),于是数据都落在(0.210,0.320)内.
②分组,确定组距和组限将数据等分成10组,组距
确定每组的组下限和组上限,组下限和组上限分别为0.210和0.221,0.221和0.232,…,0.309和0.320,填入表中的第1列.
③数出组频数在表中的第3列用唱票法(画正字)数出每组的组频数,将结果填入表中的第4列.
④计算组中值和组频率,分别填入表中的第2列和第5列.于是得到频数分布表.
频数分布表组 限
组中值?
唱票数频数
组频数
组频率
0.210~0.221
0.2155
T
2
0.02
1.82
0.221~0.232
0.2265
F
3
0.03
2.73
0.232~0.243
0.2375
正T
7
0.07
6.36
0.243~0.254
0.2485
正正正一
16
0.16
14.55
0.254~0.265
0.2595
正正正正T
22
0.22
20
0.265~0.276
0.2705
正正正正一
21
0.21
19.09
0.276~0.287
0.2815
正正正T
17
0.17
15.45
0.287~0.298
0.2925
正F
8
0.08
7.27
0.298~0.309
0.3035
F
3
0.03
2.73
0.309~0.320
0.3145
一
1
0.01
0.91
合 计
100
1
(2)作频数直方图直角坐标系中,用横轴表示数据,用纵轴表示频数,在横轴上以组距为底边,以每组的组频数为高作矩形,得到频数直方图,如图.
(3)频率直方图在频数分布表中计算频率/组距,即,见频数分布表的最后一列,在横轴上以组距为底,依次以为高(=1,2,…10)作矩形,得到频率直方图,如图.
(4)根据频数分布表及均值和方差的近似计算公式,得均值:
方差:
?
标准差:
二、综合练习
1.填空题
1.设一组试验数据为7.3,7.8,8.0,7.6,7.5,则它们的均值是,中位数是,极差是,方差是,标准差是,变异系数是,
2.设是一组数据,是它们的权,则满足(1),(2),
3.统计中将所要研究的对象的全体称为, 中的基本单位称为个体,从 中抽出的一个个体称为,一组样品组成, 称为样本值, 称为样本容量.
1,7.64;7.6;0.7;0.0584;0.2417;3.16%.
2,(1) ;(2).
3,总体;总体;总体;样品;样本;样本的取值;样本中所含样品的个数.
2.单选题
1.设是一组数据,则这组数据的标准差的计算公式是( ).
(A);(B);(C);(D).
2.设是一组数据,是它们的权,则这组数据的加权平均数和方差分别是( ).
(A);(B)
(C);(D)
3.下列各组数中,( )能作为一组数据进行加权平均数的“权”.
(A);(B);(C);(D).
1.B 2.C 3.A
3.计算题
1.全国电视歌曲大奖赛中,由10位评委为歌手打分,打分的办法是:去掉一个最高分,去掉一个最低分,其余得分求均值,就是该歌手的得分,下面是10位评委给两名歌手的打分,先用这种方法算一算两位歌手的得分,再计算每组数据的均值,想一想,这种打分方法有什么优点?
甲
10
9.5
9.4
9.3
9.4
9.2
9.3
9.2
9.5
9.2
乙
9.7
9.3
9.2
9.3
9.4
9.6
9.6
9.4
9.2
9.0
2.有两种股票,它们在5天内的收盘价如下:
A7.8元,7.9元,7.8元,7.7元,7.8元
B7.8元,6.6元,7.4元,8.2元,9.0元分别计算这两种股票的(1)5天内的平均价格和标准差,从中会得出什么结论呢?(2)极差和变异系数.
3.调查A单位职工某月收入情况,如下表:
工资档次(元)
人 数
工资档次(元)
人 数
300-500
12
800-900
84
500-600
25
900-1000
45
600-700
66
1000-1300
15
700-800
128
合计
试计算该单位职工的平均月工资.
4.有甲、乙两个不同品种的农作物种子分别播种在五块试验田上,生产条件相同,得到各试验田上的产量分别如下表:
试验田
试验田面积(hm2)
产量(kg)
编号
甲
乙
甲
乙
1
1.5
2.0
7 800
10 700
2
1.6
1.6
8 640
8 400
3
1.2
1.7
6 360
8 840
4
1.3
1.4
6 630
7 210
5
1.0
1.5
5 000
7 860
为研究两个品种的收获率,确定两个品种收获量的稳定性,试计算甲、乙两个品种的(1)平均亩产量;(2)产量的标准差;(3)各自的变异系数,(4)哪个品种较好?
5.某品牌的电话机确定用4个指标评价它的好坏,并依消费者的意见给4个指标赋予不同的权重,如果每个指标的满分是10分,那么如下这个消费者给该品牌电话机的打分是多少?
指? 标
质? 量
外? 观
价? 格
音? 质
权
50%
20%
20%
10%
打? 分
10
7
8
10
6.现有50个数据
168
162
162
163
146
150
155
148
155
158
158
160
157
154
155
176
163
156
153
159
159
160
152
159
165
175
160
148
161
162
160
154
160
150
178
165
166
157
162
162
170
166
162
167
152
149
164
168
170
149
(1)试列出这50个数据的频数分布表;
(2)作出频数直方图;
(3)作出频率直方图,并描绘出它的频率曲线;
(4)根据频数表,求出这50个数据的均值、方差、标准差.
1.①甲得分9.35;乙得分9.375.
②甲的均值=(10+9.5+9.4+9.3+9.4+9.2+9.3+9.5+9.2+9.2)=9.4
乙的均值=(9.7+9.3+9.2+9.3+9.4+9.6+9.6+9.4+9.2+9.0)=9.37
③这种打分方法的优点是:用这种方法打分,甲比乙的得分低,而用均值的方法打分,甲比乙的得分却高,这是因为甲的大部分得分比较低,但有一个极端值10分,使得它的均值就比较高;而乙的大部分得分比较高,但有一个极端值9.0分,使得它的均值就比较低; 这种极端值有可能是人为造成的.为了公正,采用去掉一个最高分和一个最低分,其余得分求均值的方法,可以剔除极端值对整体水平的影响.
2.(1)①A的平均价格是(7.8+7.9+7.8+7.7+7.8)=7.8
B的平均价格是(7.8+ 6.6+7.4+8.2+9.0)=7.8
②A的标准差==0.063,B的标准差==0.8.
③从中得到结论,B股票的股价波动大,从股票的操作上讲,股价波动大,风险大,但获利的机会也比较大.? 这是因为A股票股价的标准差是0.063,B股票股价的标准差是0.8,B股票股价的标准差大,说明股价波动大.
(2)①A,B两种股票股价的极差分别是0.2和2.4,这是因为A股票的最高价和最低价分别是7.9元和7.7元,故极差是7.9-7.7=0.2元;B股票的最高价和最低价分别是9.0元和6.6元,故极差是9.0-6.6=2.4元.
②A,B两种股票股价的变异系数分别是0.81%,10.26%,这是因为A股票的均值7.8元,标准差为0.063元,故变异系数是=0.81%;
B股票的均值为7.8元,标准差为0.8元,变异系数是=10.26%.
3.770.27
4.①每块田的单位产量为试验田
试验田面积(hm2/km2)
单位产量(kg/km2)
编号
甲
乙
甲
乙
1
1.5
2.0
5 200
5 350
2
1.6
1.6
5 400
5 250
3
1.2
1.7
5 300
5 200
4
1.3
1.4
5 100
5 150
5
1.0
1.5
5 000
5 240
②两个品种的单位平均产量分别为5 216.67,5 245.12
③两个品种的产量的标准差分别为138.81,68.26.
④各自的变异系数分别为甲品种,乙品种
⑤结论为:从上面计算看出,乙品种的单位面积平均产量略高于甲品种,变异系数也比甲品种小,说明乙品种收获率具有较大的稳定性,即乙品种比甲品种的收获率具有较大的稳定性.
5.9分
6.(1)
频数分布表组 限
组中值xi
组频数vi
组频率fi
fi /d
145--152
148.5
7
0.14
0.02
152--159
155.5
11
0.22
0.031
159--166
162.5
22
0.44
0.063
166--173
169.5
7
0.14
0.02
173--180
176.5
3
0.06
0.009
合 计
50
1
(2)作出频数直方图
(3)频率直方图
(4)根据频数分布表计算,则这50个数据的均值160.82,方差54.0176,标准差7.35,
1.重要特征数例1设一组数据为78.2;88.2;79.3;80.5;83.4;81.2;76.3;86.5
求这组数据的(1)均值;(2)中位数;(3) 极差;(4) 方差及标准差;(5)变异系数,
解:将数据由小到大顺序排列为
76.3;78.2;79.3;80.5;81.2;83.4;86.5;88.2
(1)均值(76.3+78.2+79.3+80.5+81.2+83.4+86.5+88.2)
×653.6?81.7
(2)中位数共有8个数据,中间两个数是80.5和81.2,故中位数? ?(80.5+81.2) =80.85
(3)极差最大数是88.2,最小数是76.3,故极差?88.2-76.3?11.9
(4)方差?[(76.3-81.7)2+(78.2-81.7)2+┅+(88.2-81.7)2]×117.04=14.63
标准差??3.82
(5)变异系数
例2某公司制定下一年度计划时,由A,B,C,D,E五人预测下年度的销售量(单位:吨),分别为1300;1250;1 200;1230;1280
如果考虑到每人在公司的地位和作用,以及不同的业务水平,分别给予不同的权重,若A,B的权各为30%,C,D的权各为10%,E的权为20%,求下年度销售量的预测值及其方差.
解:根据加权平均数的计算公式有
?1300×30%+1250×30%+1200×10%+1230×10%+1280×20%?1264
即下年度销售量的预测值是1264吨.
方差(1300-1264)2×30%+(1250-1264)2×30%+┅+(1280-1264)2×20%
1024
标准差?
二、直方图例1 某项试验测得100个数据如下
0.253
0.222
0.267
0.278
0.269
0.315
0.235
0.295
0.238
0.275
0.289
0.265
0.248
0.256
0.295
0.259
0.272
0.281
0.261
0.305
0.251
0.239
0.278
0.251
0.280
0.263
0.257
0.278
0.246
0.285
0.254
0.249
0.302
0.250
0.271
0.260
0.258
0.272
0.253
0.284
0.255
0.290
0.271
0.259
0.257
0.273
0.246
0.233
0.249
0.270
0.266
0.279
0.242
0.220
0.258
0.271
0.257
0.273
0.274
0.244
0.288
0.259
0.270
0.241
0.273
0.296
0.248
0.244
0.300
0.254
0.277
0.244
0.268
0.261
0.253
0.282
0.282
0.256
0.283
0.263
0.252
0.281
0.236
0.230
0.258
0.255
0.286
0.260
0.278
0.272
0.248
0.279
0.297
0.270
0.213
0.261
0.231
0.264
0.273
0.296
(1)试列出这100个数据的频数分布表;
(2)作出频数直方图;
(3)作出频率直方图,并描绘出它的频率密度曲线;
(4)根据频数表,求出这100个数据的均值、方差、标准差.
解:(1)作频数分布表
①确定范围找出100个数据中的最大值和最小值,分别是0.315和0.213.取=0.210(<0.213),=0.320(>0.315),于是数据都落在(0.210,0.320)内.
②分组,确定组距和组限将数据等分成10组,组距
确定每组的组下限和组上限,组下限和组上限分别为0.210和0.221,0.221和0.232,…,0.309和0.320,填入表中的第1列.
③数出组频数在表中的第3列用唱票法(画正字)数出每组的组频数,将结果填入表中的第4列.
④计算组中值和组频率,分别填入表中的第2列和第5列.于是得到频数分布表.
频数分布表组 限
组中值?
唱票数频数
组频数
组频率
0.210~0.221
0.2155
T
2
0.02
1.82
0.221~0.232
0.2265
F
3
0.03
2.73
0.232~0.243
0.2375
正T
7
0.07
6.36
0.243~0.254
0.2485
正正正一
16
0.16
14.55
0.254~0.265
0.2595
正正正正T
22
0.22
20
0.265~0.276
0.2705
正正正正一
21
0.21
19.09
0.276~0.287
0.2815
正正正T
17
0.17
15.45
0.287~0.298
0.2925
正F
8
0.08
7.27
0.298~0.309
0.3035
F
3
0.03
2.73
0.309~0.320
0.3145
一
1
0.01
0.91
合 计
100
1
(2)作频数直方图直角坐标系中,用横轴表示数据,用纵轴表示频数,在横轴上以组距为底边,以每组的组频数为高作矩形,得到频数直方图,如图.
(3)频率直方图在频数分布表中计算频率/组距,即,见频数分布表的最后一列,在横轴上以组距为底,依次以为高(=1,2,…10)作矩形,得到频率直方图,如图.
(4)根据频数分布表及均值和方差的近似计算公式,得均值:
方差:
?
标准差:
二、综合练习
1.填空题
1.设一组试验数据为7.3,7.8,8.0,7.6,7.5,则它们的均值是,中位数是,极差是,方差是,标准差是,变异系数是,
2.设是一组数据,是它们的权,则满足(1),(2),
3.统计中将所要研究的对象的全体称为, 中的基本单位称为个体,从 中抽出的一个个体称为,一组样品组成, 称为样本值, 称为样本容量.
1,7.64;7.6;0.7;0.0584;0.2417;3.16%.
2,(1) ;(2).
3,总体;总体;总体;样品;样本;样本的取值;样本中所含样品的个数.
2.单选题
1.设是一组数据,则这组数据的标准差的计算公式是( ).
(A);(B);(C);(D).
2.设是一组数据,是它们的权,则这组数据的加权平均数和方差分别是( ).
(A);(B)
(C);(D)
3.下列各组数中,( )能作为一组数据进行加权平均数的“权”.
(A);(B);(C);(D).
1.B 2.C 3.A
3.计算题
1.全国电视歌曲大奖赛中,由10位评委为歌手打分,打分的办法是:去掉一个最高分,去掉一个最低分,其余得分求均值,就是该歌手的得分,下面是10位评委给两名歌手的打分,先用这种方法算一算两位歌手的得分,再计算每组数据的均值,想一想,这种打分方法有什么优点?
甲
10
9.5
9.4
9.3
9.4
9.2
9.3
9.2
9.5
9.2
乙
9.7
9.3
9.2
9.3
9.4
9.6
9.6
9.4
9.2
9.0
2.有两种股票,它们在5天内的收盘价如下:
A7.8元,7.9元,7.8元,7.7元,7.8元
B7.8元,6.6元,7.4元,8.2元,9.0元分别计算这两种股票的(1)5天内的平均价格和标准差,从中会得出什么结论呢?(2)极差和变异系数.
3.调查A单位职工某月收入情况,如下表:
工资档次(元)
人 数
工资档次(元)
人 数
300-500
12
800-900
84
500-600
25
900-1000
45
600-700
66
1000-1300
15
700-800
128
合计
试计算该单位职工的平均月工资.
4.有甲、乙两个不同品种的农作物种子分别播种在五块试验田上,生产条件相同,得到各试验田上的产量分别如下表:
试验田
试验田面积(hm2)
产量(kg)
编号
甲
乙
甲
乙
1
1.5
2.0
7 800
10 700
2
1.6
1.6
8 640
8 400
3
1.2
1.7
6 360
8 840
4
1.3
1.4
6 630
7 210
5
1.0
1.5
5 000
7 860
为研究两个品种的收获率,确定两个品种收获量的稳定性,试计算甲、乙两个品种的(1)平均亩产量;(2)产量的标准差;(3)各自的变异系数,(4)哪个品种较好?
5.某品牌的电话机确定用4个指标评价它的好坏,并依消费者的意见给4个指标赋予不同的权重,如果每个指标的满分是10分,那么如下这个消费者给该品牌电话机的打分是多少?
指? 标
质? 量
外? 观
价? 格
音? 质
权
50%
20%
20%
10%
打? 分
10
7
8
10
6.现有50个数据
168
162
162
163
146
150
155
148
155
158
158
160
157
154
155
176
163
156
153
159
159
160
152
159
165
175
160
148
161
162
160
154
160
150
178
165
166
157
162
162
170
166
162
167
152
149
164
168
170
149
(1)试列出这50个数据的频数分布表;
(2)作出频数直方图;
(3)作出频率直方图,并描绘出它的频率曲线;
(4)根据频数表,求出这50个数据的均值、方差、标准差.
1.①甲得分9.35;乙得分9.375.
②甲的均值=(10+9.5+9.4+9.3+9.4+9.2+9.3+9.5+9.2+9.2)=9.4
乙的均值=(9.7+9.3+9.2+9.3+9.4+9.6+9.6+9.4+9.2+9.0)=9.37
③这种打分方法的优点是:用这种方法打分,甲比乙的得分低,而用均值的方法打分,甲比乙的得分却高,这是因为甲的大部分得分比较低,但有一个极端值10分,使得它的均值就比较高;而乙的大部分得分比较高,但有一个极端值9.0分,使得它的均值就比较低; 这种极端值有可能是人为造成的.为了公正,采用去掉一个最高分和一个最低分,其余得分求均值的方法,可以剔除极端值对整体水平的影响.
2.(1)①A的平均价格是(7.8+7.9+7.8+7.7+7.8)=7.8
B的平均价格是(7.8+ 6.6+7.4+8.2+9.0)=7.8
②A的标准差==0.063,B的标准差==0.8.
③从中得到结论,B股票的股价波动大,从股票的操作上讲,股价波动大,风险大,但获利的机会也比较大.? 这是因为A股票股价的标准差是0.063,B股票股价的标准差是0.8,B股票股价的标准差大,说明股价波动大.
(2)①A,B两种股票股价的极差分别是0.2和2.4,这是因为A股票的最高价和最低价分别是7.9元和7.7元,故极差是7.9-7.7=0.2元;B股票的最高价和最低价分别是9.0元和6.6元,故极差是9.0-6.6=2.4元.
②A,B两种股票股价的变异系数分别是0.81%,10.26%,这是因为A股票的均值7.8元,标准差为0.063元,故变异系数是=0.81%;
B股票的均值为7.8元,标准差为0.8元,变异系数是=10.26%.
3.770.27
4.①每块田的单位产量为试验田
试验田面积(hm2/km2)
单位产量(kg/km2)
编号
甲
乙
甲
乙
1
1.5
2.0
5 200
5 350
2
1.6
1.6
5 400
5 250
3
1.2
1.7
5 300
5 200
4
1.3
1.4
5 100
5 150
5
1.0
1.5
5 000
5 240
②两个品种的单位平均产量分别为5 216.67,5 245.12
③两个品种的产量的标准差分别为138.81,68.26.
④各自的变异系数分别为甲品种,乙品种
⑤结论为:从上面计算看出,乙品种的单位面积平均产量略高于甲品种,变异系数也比甲品种小,说明乙品种收获率具有较大的稳定性,即乙品种比甲品种的收获率具有较大的稳定性.
5.9分
6.(1)
频数分布表组 限
组中值xi
组频数vi
组频率fi
fi /d
145--152
148.5
7
0.14
0.02
152--159
155.5
11
0.22
0.031
159--166
162.5
22
0.44
0.063
166--173
169.5
7
0.14
0.02
173--180
176.5
3
0.06
0.009
合 计
50
1
(2)作出频数直方图
(3)频率直方图
(4)根据频数分布表计算,则这50个数据的均值160.82,方差54.0176,标准差7.35,