第一单元 重要的特征数一、学习目标介绍数据处理的几个常见概念,要求了解总体、样本、均值、方差等基本概念,会计算均值和方差等重要特征数.
二、内容讲解我们把所研究对象的全体称为总体,而组成总体的基本单位称为个体.从总体中抽取出来的个体称为样品,若干个样品组成的集合称为样本,一个样本中所含样品的个数称为样本容量(或大小),n个样品组成的样本用x1,x2,…,xn表示.我们把样品的取值称为样品值,样本的取值称为样本值,也称为样本数据.
1.均值:给定一组数据,称为数据的均值.
2.加权平均数:给定一组数据和一组正数,且,称为的加权平均数,称为的权.
3.中位数:将一组有限个数据,按由小到大的次序排成数列,记为,
(1)当n为奇数时,处于中间位置的数称为中位数,此时中间位置是,中位数就是;
(2)当n为偶数时,中间位置有两个数,它们的平均值就是中位数,即
?=
在有一些问题中间,光依靠数据的平均数这个特征数是不足以说明问题的,还要依靠第二个重要的特征数,这就是方差和标准差。那么什么是方差和标准差呢?先看一个例子。
例二个厂生产同类产品,各抽取二袋检查净重(单位:g),结果为:
样品一
样品二
均值
甲厂
100
100
100
乙厂
150
50
100
标准重为100g的产品,
甲厂:;乙厂:
两个厂家生产的产品的均值是相同的,但是与标准重量100g是有偏差的:
甲厂:;乙厂:
甲厂没有偏差,乙厂的偏差为2500,说明乙厂的产品质量不如甲厂的产品质量好.
4.方差:给定一组数据,称为数据的方差,其中是的均值
5.标准差:称方差的算术平方根为数据的标准差(也称为均方差).
6.加权方差:给定一组数据,它们的权为,称为数据的加权方差,其中是的加权平均数.
7.极差:给定一组数据中的最大值与最小值之差,称为的极差.
问题:方差为0的一组数据有什么特点?这组数据是同一常数.
三、例题讲解例1商场销售一种新产品,统计前5天的销售量,分别为(单位:个)
38 42 36 45 39
求这种新产品平均每天的销售量是多少?
解:根据均值的计算公式得
即这种新产品平均每天销售40个.
例2 统计20名学生的考试成绩情况如下:
成绩
100
98
97
95
人数
10
6
3
1
求这20 人的平均成绩。
解:可以把20人的成绩加起来再除以20计算。
错误算法
或者:20名学生的平均成绩为
或写成:
例3某种商品的评价表:
内在质量
外观
包装
权重
70%
20%
10%
得分
9
10
7
则这件商品的得分是
例4统计20名学生的考试成绩情况如下:
成绩
100
98
97
95
人数
10
6
3
1
求这20人的成绩的方差.
解:前面已经计算出平均成绩为98.7,则成绩的加权方差是
=2.11
标准差
四、课堂练习练习1调查七个城市居民对所在城市某系统服务质量的满意度,具体数据如下表城市名称
A
B
C
D
E
F
G
很满意或比较满意比例(%)
66
61
51
64
64
54
63
不太满意或很不满意(%)
9
7
12
7
4
7
6
满意度
3.62
3.64
3.43
3.62
3.67
3.52
3.73
试填写下表
均值
中位数
极差
标准差
变异系数
很满意或比较满意比例(%)
不太满意或很不满意(%)
满意度
并由此分析七个城市居民对该系统服务的满意程度.
计算一组数据的特征数,可采用基本公式或简化公式计算.若需求中位数和极差等与顺序有关的特征数,则应先将数据按大小顺序排列起来,数据由小到大顺序排列时,后一个数据要大于或等于前一个数据,且不要遗漏,也不要重复,该指标的七个数据由小到大顺序排列为51,54,61,63,64,64,66,
练习2 某学校对学生某科的期末成绩按如下方法考评:平时作业占20%;期中考试占30%;期末考试占50%,现有甲、乙两个学生的成绩分别如下:
平时作业
期中考试
期末考试
甲
90
95
100
乙
100
95
90
试求这两名学生的期末成绩和标准差.
如果不考虑每个数据的权重,则每个学生的成绩就是“平时作业”、“期中考试”和“期末考试”三个成绩的平均值.而现在要考虑数据的权重,因此要用加权平均数的公式计算,如果给定一组数据,它们的权分别是,则这组数据的加权平均数是.甲的期末成绩是=90×20%+95×30%+100×50%=96.5
五、课后作业
1.某班有15名学生,在一次英语考试中,成绩如下:
56 60 62 58 61 64 64 62
62 99 64 95 59 62 92
求这15名学生英语成绩的(1)均值;(2)中位数;(3)你认为哪个平均数比较好地“代表”了这15名学生的英语成绩?
2.某工厂第一季度四次购进某材料,每次购进的数量和单价如下表,试求该材料的平均价格.
数量(千克)
2000
2500
1800
2100
价格(元)
4.5
4.2
5.0
4.4
3.从一年级、三年级和六年级的小学生中各随机抽查5名男学生,测其体重如下表(单位:千克).
学生
一年级
三年级
六年级
1
17.5
30.2
43.3
2
22.6
29.9
35.2
3
24.0
20.4
27.5
4
21.2
22.8
38.4
5
19.2
23.0
26.5
合计
体重均值
体重标准差
体重变异系数
有这些数据分别计算每个年级男生体重的均值、标准差、变异系数,填入表内.
1.(1)均值68;(2)中位数62;(3)用中位数作这组数据的“代表”要好一些,因为这组数据中有12个数据在56~64之间,只有3个在92以上.
2,3.4493元;
合计
104.5
126.3
170.9
体重平均值
20.9
25.26
34.18
体重标准差
2.33
4.02
6.41
体重变异系数
11.15%
15.91%
18.76%
3.
二、内容讲解我们把所研究对象的全体称为总体,而组成总体的基本单位称为个体.从总体中抽取出来的个体称为样品,若干个样品组成的集合称为样本,一个样本中所含样品的个数称为样本容量(或大小),n个样品组成的样本用x1,x2,…,xn表示.我们把样品的取值称为样品值,样本的取值称为样本值,也称为样本数据.
1.均值:给定一组数据,称为数据的均值.
2.加权平均数:给定一组数据和一组正数,且,称为的加权平均数,称为的权.
3.中位数:将一组有限个数据,按由小到大的次序排成数列,记为,
(1)当n为奇数时,处于中间位置的数称为中位数,此时中间位置是,中位数就是;
(2)当n为偶数时,中间位置有两个数,它们的平均值就是中位数,即
?=
在有一些问题中间,光依靠数据的平均数这个特征数是不足以说明问题的,还要依靠第二个重要的特征数,这就是方差和标准差。那么什么是方差和标准差呢?先看一个例子。
例二个厂生产同类产品,各抽取二袋检查净重(单位:g),结果为:
样品一
样品二
均值
甲厂
100
100
100
乙厂
150
50
100
标准重为100g的产品,
甲厂:;乙厂:
两个厂家生产的产品的均值是相同的,但是与标准重量100g是有偏差的:
甲厂:;乙厂:
甲厂没有偏差,乙厂的偏差为2500,说明乙厂的产品质量不如甲厂的产品质量好.
4.方差:给定一组数据,称为数据的方差,其中是的均值
5.标准差:称方差的算术平方根为数据的标准差(也称为均方差).
6.加权方差:给定一组数据,它们的权为,称为数据的加权方差,其中是的加权平均数.
7.极差:给定一组数据中的最大值与最小值之差,称为的极差.
问题:方差为0的一组数据有什么特点?这组数据是同一常数.
三、例题讲解例1商场销售一种新产品,统计前5天的销售量,分别为(单位:个)
38 42 36 45 39
求这种新产品平均每天的销售量是多少?
解:根据均值的计算公式得
即这种新产品平均每天销售40个.
例2 统计20名学生的考试成绩情况如下:
成绩
100
98
97
95
人数
10
6
3
1
求这20 人的平均成绩。
解:可以把20人的成绩加起来再除以20计算。
错误算法
或者:20名学生的平均成绩为
或写成:
例3某种商品的评价表:
内在质量
外观
包装
权重
70%
20%
10%
得分
9
10
7
则这件商品的得分是
例4统计20名学生的考试成绩情况如下:
成绩
100
98
97
95
人数
10
6
3
1
求这20人的成绩的方差.
解:前面已经计算出平均成绩为98.7,则成绩的加权方差是
=2.11
标准差
四、课堂练习练习1调查七个城市居民对所在城市某系统服务质量的满意度,具体数据如下表城市名称
A
B
C
D
E
F
G
很满意或比较满意比例(%)
66
61
51
64
64
54
63
不太满意或很不满意(%)
9
7
12
7
4
7
6
满意度
3.62
3.64
3.43
3.62
3.67
3.52
3.73
试填写下表
均值
中位数
极差
标准差
变异系数
很满意或比较满意比例(%)
不太满意或很不满意(%)
满意度
并由此分析七个城市居民对该系统服务的满意程度.
计算一组数据的特征数,可采用基本公式或简化公式计算.若需求中位数和极差等与顺序有关的特征数,则应先将数据按大小顺序排列起来,数据由小到大顺序排列时,后一个数据要大于或等于前一个数据,且不要遗漏,也不要重复,该指标的七个数据由小到大顺序排列为51,54,61,63,64,64,66,
练习2 某学校对学生某科的期末成绩按如下方法考评:平时作业占20%;期中考试占30%;期末考试占50%,现有甲、乙两个学生的成绩分别如下:
平时作业
期中考试
期末考试
甲
90
95
100
乙
100
95
90
试求这两名学生的期末成绩和标准差.
如果不考虑每个数据的权重,则每个学生的成绩就是“平时作业”、“期中考试”和“期末考试”三个成绩的平均值.而现在要考虑数据的权重,因此要用加权平均数的公式计算,如果给定一组数据,它们的权分别是,则这组数据的加权平均数是.甲的期末成绩是=90×20%+95×30%+100×50%=96.5
五、课后作业
1.某班有15名学生,在一次英语考试中,成绩如下:
56 60 62 58 61 64 64 62
62 99 64 95 59 62 92
求这15名学生英语成绩的(1)均值;(2)中位数;(3)你认为哪个平均数比较好地“代表”了这15名学生的英语成绩?
2.某工厂第一季度四次购进某材料,每次购进的数量和单价如下表,试求该材料的平均价格.
数量(千克)
2000
2500
1800
2100
价格(元)
4.5
4.2
5.0
4.4
3.从一年级、三年级和六年级的小学生中各随机抽查5名男学生,测其体重如下表(单位:千克).
学生
一年级
三年级
六年级
1
17.5
30.2
43.3
2
22.6
29.9
35.2
3
24.0
20.4
27.5
4
21.2
22.8
38.4
5
19.2
23.0
26.5
合计
体重均值
体重标准差
体重变异系数
有这些数据分别计算每个年级男生体重的均值、标准差、变异系数,填入表内.
1.(1)均值68;(2)中位数62;(3)用中位数作这组数据的“代表”要好一些,因为这组数据中有12个数据在56~64之间,只有3个在92以上.
2,3.4493元;
合计
104.5
126.3
170.9
体重平均值
20.9
25.26
34.18
体重标准差
2.33
4.02
6.41
体重变异系数
11.15%
15.91%
18.76%
3.