第六章 统计推断
本章重点和难点
? 重点,
1、假设检验的基本思想
2、几种常用的检验方法
? 难点,
假设检验的基本思想
? 统计研究的目的在于由样本特征来推断总
体情况。
? 其任务为:一是用样本统计量来估计总体
参数,即参数估计;二是通过样本的统计
指标来判定总体参数是否相等的问题,即
假设检验。
第一节 参数估计
一、参数估计的若干概念
? (一)误差
? 统计上所指的误差,泛指测得值与真值
之差,以及样本指标与总体指标之差。
主要有四种,
1、随机误差
2、系统误差
3、抽样误差
4、过失误差
? 随机误差和过失误差在统计处理中一般
不予考虑。
? 而系统误差和抽样误差在统计分析中则
必须认真对待,不可忽视。
(二)抽样误差及其标准误
? 由抽样造成的样本均数(或样本率)与
总体均数(或总体率)的偏差,便称之
为, 均数的(或率的)抽样误差, 。
? 度量抽样误差大小的指标--标准误
? 依统计资料的性质(, 计数, 和, 计
量, )不同,有, 均数的标准误, 和
,率的标准误, 。
1、标准误的意义与计算
? (1)标准误的意义
? 用来表示样本均数与总体均数间偏差程
度的标准差称之为标准误。
? 标准误的意义在于:当标准误较小时,
表明抽样误差小,以样本统计量平均数
推断总体参数 μ 的可靠性大;反之亦然。
标准差与标准误的区别


描述
对象
意义 用途
标准差
S
各个
体值
反映个体
值间的变

表示个体值间的波动
大小,反映观察值的
离散程度。
标准误
样本
均数
反映均数
的抽样误

表示样本均数在推断、
估计时的可靠程度。
xS
xS
(2)标准误的计算
? 1)均数的标准误的计算
? 根据数理统计的研究结果,均数的标准误与总
体标准差及样本含量的关系由下式表示,
? 在实际应用中,通常用 S代替 σ,所以可写成,
X n
?? ?
X
SS
n
?
? 以上两公式表明,均数的标准误与标准
差成正比,标准差愈大,则标准误愈大;
而与样本含量的平方根成反比,样本含
量愈大,则标准误愈小。
? 因此,在抽样研究中,为了减少抽样误
差,应尽可能保证足够大的样本含量。
2)率的标准误的计算
? 在实际工作中计算率的标准误公式为,
? 例 6.2,P106
(1 )
p
ppS
n
??
二、区间估计
? 参数估计分为点估计与区间估计。
? 参数的点估计是选定一个适当的样本统
计量作为参数的估计量,并计算出估计
值。
? 参数的区间估计是以变量的概率分布规
律来确定未知参数值的可能范围的方法。
? 在区间估计中,预选规定的概率,称为
置信概率。置信概率或置信水平(符号
为 1 - α )常取 95%(或 99%),按
此确定的置信区间分别称之为 95%(或
99% )置信区间。
? 置信区间的理论内涵。
? 置信区间是以上、下置信限为界,而置
信限是置信区间的上下界值。当给出
,样本均数 ± 标准误, 或, 样本率 ± 率
的标准误, 时,可据此得到参数的置信
区间。
(一)总体均数的区间估计
1、大样本含量
? 当样本含量较大时,如 n≥45,根据正态分布的原理,可按下表
给定的置信限估计总体均数的置信区间。
总体均数置信区间的估计与表达( n≥45 )
置信概率
( 1- α )
置信限
( CL)
置信区间
0.95
0.99
12(,)LL
1,9 6 xxS?
2,5 8 xxS?
( 1, 9 6,1, 9 6 )xxx S x S??
( 2, 5 8,2, 5 8 )xxx S x S??
? 例题 6.3,P108
? 当置信概率确定后,抽样误差愈小,置
信区间愈窄,即参数估计的精度愈高。
由于样本含量 n愈大,抽样误差愈小,故
可以认为 n愈大,估计精确度愈高。
例题 1,
? 某市 100名高三学生男生 800米成绩的
平均数为 160.29秒,已知总体的标准差
为 9.35秒。假设 800米跑成绩服从正态
分布,试对总体均数进行区间估计。置
信度分别取 95%和 99%。
例题 2,
? 某体院一年级某班 36人的运动解剖学考
试平均成绩为 72分。依照过去一年的经
验,全部学生的分数的标准差为 10.2分。
试以 95%的置信度估计一年级全体学生
的平均分数。
2、小样本含量 (例题 6.4,P109)
? 当样本含量较小时,如 n< 45,根据 t分布的原理,可按下表给
定的置信限估计总体均数的置信区间。
总体均数置信区间的估计与表达( n< 45 )
置信概率
( 1- α )
置信限
( CL)
置信区间
0.95
0.99
12(,)LL
'0,0 5 / 2 () xx t n S?
'0,0 1 / 2 () xx t n S?
''0, 0 5 / 2 0, 0 5 / 2( ( ),( ) )xxx t n S x t n S??
''0, 0 1 / 2 0, 0 1 / 2( ( ),( ) )xxx t n S x t n S??
例题 3,
? 某体院篮球专业 16名男生的 100米跑平
均成绩为 13秒。 S= 0.5秒。假设 100米
跑成绩服从正态分布,试求全体篮球专
业男生 100米跑成绩均值的 95%的置信
区间。
? 当 n=50时,其置信区间为?
(二)总体率的区间估计
(例题 6.5,P110)
? 当样本含量足够大时 (如 n> 100),p的抽样分布逼近正态,
可按下表给定的置信限估计总体率的置信区间。
总体率置信区间的估计与表达
置信概率
( 1- α )
置信限
( CL)
置信区间
0.95
0.99
12(,)LL
1,9 6p S p?
2,5 8p S p?
( 1, 9 6,1, 9 6 )p S p p S p??
( 2, 5 8,2, 5 8 )p S p p S p??
第二节
假设检验的基本思想及步骤
假设检验
? 假设检验是将引起差异的抽样误差和非
抽样误差区分开来,看一看哪一个占主
导地位。假设检验是通过样本确定接受
还是拒绝统计假设的统计推断方法。
? 参数检验是对总体参数量值的假设检验,
非参数检验主要是对总体分布形式的假
设检验。
一、假设检验的基本思想
? 首先提出一个关于总体的原假设,假设
差异仅仅由抽样误差引起的,没有本质区别。
他的判断依据是一个小概率事件原理,即:
小概率事件在一次实验中是几乎不可能发生
的,那么在 成立前提下,若出现了一个小
概率事件,拒绝假设。反之,接受假设。
? 因此,我们说这是一种带有概率性质的反证
法。
0H
0H
二、假设检验的步骤
? 根据实际情况建立, 原假设, 。
? 在假设检验的前提下,选择和计算统计量。
? 根据实际情况确定显著水平 α,一般取 α = 0.05或
α = 0.01,并根据 α 查出相应的临界值。
? 判断结果,将计算的统计量与相应的临界值比较,
如果前者 ≥后者,概率 P≤α,则差异显著,否定
原假设;如果前者 <后者,概率 P> α,则差异不
显著,接受原假设。
0H
三、双侧检验和单侧检验
? (一)双侧检验
? 否定域对称分布于曲线两侧的检验称为
双侧检验。
? 当所要比较的两样本统计量的总体参数
事先无法肯定哪个大于哪个时,就要采
用双侧检验的手段进行检验。
(二)单侧检验
? 否定域仅存在于分布曲线一侧的检验,
称为单侧检验。
? 在很多情况下,对样本均值比较时,事
先预知某样本所属的总体均数只能大于
另一个样本所属的总体均数时,就可采
用单侧检验的手段进行检验。
四、假设检验中的两类错误
? (一)错否定,即, 原假设, 实际
上是正确的,而检验结论是否
定,此时犯下, 弃真, 错误,
统计上称为第 Ⅰ 类错误。
? (二)错接受,即, 原假设, 实际
上是不正确的,而检验结论却接受
了,此时犯下, 取伪, 错误,
统计上称为第 Ⅱ 类错误。
0H
0H
? 当样本含量一定时,弃真概率 α 和取伪
概率 β 不可能同时减小,一个减小另一
个就会增大。要使他们同时减小,只有
增加样本含量,减小抽样误差。
第三节 几种常用的检验方法
一,t检验
? (一) t分布
? t统计量的公式为,
x
x
t
S
??
?
? (一) t分布
? 从正态分布总体 N( μ, )中抽出含量为
n的一切可能的样本,由样本均数及标准误
经 t转换就成了服从自由度为 n- 1的 t分布。
其特点为:以 0为中心,两侧左右对称,曲
线中间比正态分布低,两侧翘得比正态分布
高。当自由度越小,t分布与正态分布偏离
越大;当自由度越大时,t分布逐渐逼近于
正态分布;当自由度 ∞ 时,t分布曲线几乎
完全与正态分布曲线吻合。
2?
(二) t检验的类型
? 1、样本均数与总体均数的 t检验
例题 6.6,P115~116。
? 2、两样本均数的差异显著性检验
A、大样本的情况
例题 6.7,P116~117。
B、小样本的情况
例题 6.8,P117~118。
当两总体方差不等时,用 检
验,进行推断。
? 统计量的公式为,
't
't
12
'
22
12
12
xx
t
SS
nn
?
?
?
0H
? 当 成立时,对给定的显著水平 α,其
临界值为,(例 6.9,P119)
? 把求出 的临界值与计算的 值作比较,
从而确定 的拒绝域和接受域。
't
't
't
0H
22
12
/ 2 1 / 2 2
' 12
22
12
12
( 1 ) ( 1 )
SS
t n t n
nn
t
SS
nn
??
? ? ? ? ?
?
?
3、配对实验数据的差异显著性检验
? 例 6.10,P120~121。
? 一般用于实验前后的比较或不同训练方
法的比较。
二,u检验
? (一)样本率与总体率的显著性检验
? 例 6.11,P121~122。
? (二)两个样本率的显著性检验
? 例 6.11,P122~123。
三,检验
2?
2?
? 用 作为检验量的假设检验称为
检验,该检验所依据的分布称为 分
布。常用于两个或两个以上样本率之间
差别的显著性检验。
2?
2?
(一) 分布
? 定义:设随机变量 相对独立,并且
均服从标准正态分布。则随机变量
? 服从参数为 n的 分布。
? 分布曲线是一条高峰偏向左侧的曲线,n
越小偏度越大;当 n足够大时,曲线趋于对称。
2?
2?
2?
1,2,,nx x xL
2 2 2 2
12 nx x x? ? ? ?L
(二)两样本率的 检验
? 在对样本率进行 检验时,常采用表格方
式进行处理,这种表格称为 R× C联表,R和
C分别表示格子的行列数。
? 检验的基本公式,
? 其中,A为实际发生数。 T为理论预计数。
? 例 6.13,P124~126。
2?
2?
2?
2
2 ()AT
T
? ?? ?
对于 2× 2联表的计算可采用下
列简化公式计算,
? a,b,c,d分别代表基本格子里的数据。
2
2 ()
( ) ( ) ( ) ( )
a b b c n
a b c d a c b d
?
?
?
? ? ? ?
(三)多个率的 检验
? 例 6.14,P127~ 129。
? 多个率的 值计算,可以由实际数直接
计算得到。计算公式为,
? 其中 n为总例数,A为实际数,分别为
与某格子实际数( A)同行、同列的合计数。
2?
2?
2
2 ( 1 )
rc
An
nn
? ??
??
,rcnn
(四) 拟合优度(正态性)检验
? 正态性检验可采用 检验的方法,其
值计算式为,
? 式中,为频数分布表中第 i组的组内数,
?,
? 为第 i组的组上限,k为组数
2?
2?
2?
2
2
1 2
()k ii
i
f n P
nP
?
?
?? ?
if
? ?1i i iP P L x L??? p
iL
? 例 6.15,P129~130。
第四节
假设检验方法在体育中的应用
一、假设检验方法在儿童若干
心理指标比较中的应用
? 研究目的
? 研究对象及样本含量
? 比较指标
? 检验方法及结果
? 结论
二、假设检验方法在跨栏教学
方法比较研究中的应用
? 目的
? 对象及样本含量
? 实验效应指标
? 检验方法及结果
? 结论
三、假设检验方法在排球落点
比较研究中的应用
? 目的
? 调查对象
? 测试方法
? 统计处理和检验
? 结果
? 结论
第六章习题
? P134~136
? 要求每道题都做。
谢谢大家!