统计假设
一、教学目的
1检验的基本思想,掌握假设检验的基本步骤,了解假设检验可能产生的两种错误。
2了解单个与两个正态总体的均值与方差的假设检验。
3了解总体分布假设的检验法,检验法,检验法
二、教学重点
1假设检验的基本步骤,检验法
2单个正态总体的均值与方法的假设检验
三、教学难点
1非参数的假设检验
2正态母体总数的置信区间。
3柯尔莫歌洛夫拟合检验检验
§7.1假设检验的基本思想和概念
统计假设:有关未知分布的假设
①原假设:第一个假设(陈述的否定)
②备择假设:第二个假设(陈述本身) ?1500
参数假设 :及到未知参数本身的统计假设
非参数假设:未知分布函数的类型或者它的某些特征提出假设
如
计假设问题:在给定备择假设的前提下,对原假设作出判断 。
(1)拒绝 ,则接受 。
(2)接受 ,则拒绝
该法则称为对 的一个检验法则,有时简称检验。
拒绝域(临界域):将子样空间划分为两个互不相交的子集
当子样观测值点则拒绝
当子样观测值点则拒绝
5.假设检验可能发生的两类错误。
1第一类错误(风险)“弃真”:原假设正确,却错误的拒绝
即
2第二类错误(风险)“收伪”:原假设不正确,却错误的接受
即
6.显著性检验问题。
对犯第一类错误加以控制,而不考虑第二类错误。在这一原则下,寻找临界域C只涉及到原假设,不涉及备择假设
7显著性水平
在进行显著性检验时,给定的犯第一类错误概率
二、小概率原理(实用统计原理)
小概率事件在一次实际实验中是不可能发生的。如果在一次实验中,居然发生了,人们宁愿认为该事件的前提条件起了变化(或发生了错误,或人为安排,或属于一种反常现象)。
三、假设检验的一般步骤:
根据问题提出原假设H和备择假设H,要明白根据样本值x,x,…,x去检验什么样的问题。
寻找检验H的合适统计量。
由给定的显著水平,根据统计量的分布,查表定出相应的分位数的值,即临界值。(确定拒绝域)
根据实测的样本值,具体计算出所统计量的值。视此值是否落入拒绝域。做出H是否成立的判断。
作业P1.2.3
§7.2参数假设检验
一、U-检验:
双边检验:设,,…,取自正态母体N(,)的一个样本,为已知常数。
(1)检验假设H: H:
(2)构造U统计量 ~N(0,1)
(3)给定显著性水平,查正态分布表,使P {}=
即 P{=1- P()=1-
2
上侧分位点 使P()=1-
确定拒绝域D:{(--)(,+)}
(4)计算子样的值,判断其是否落入拒绝域。
Eg1。P7.2
2.单边检验
检验假设H:,H:
此时拒绝域确定方法有差别
P{}=为小概率事件
即P{}=
查正态分布表,k= 拒绝域D(-,)
检验H:,H:
确定拒绝域,分两种情况:
(I) 拒绝域D(-,)
(ii),对于任何样本观测有:
~N(0,1)
在给定条件下,使P()=
即
由于事件{}{}
所以P()P()
对假设H而言,拒绝域仍为D
验H:,H:
此时拒绝域为D=(,+)
检验H:,H:
拒绝域为D=(,+)
二、t-检验
方差未知,对正态总体N()中参数进行检验
1双边检验
①H: H:
②构造t统计量 。t=~t(n-1)
其中s= ,即用子样方差s,替代原来的总体方差
③给定显著性水平,确定拒绝域
P()=,P()=1-
查t-分布表,自由度取n-1,确定分位点(n-1)
确定拒绝域D=(--t(n-1))(t,+)
1.2 单边检验
H:,H:
拒绝域D=(--t(n-1))
H:,H:
拒绝域D=(--t(n-1))
H:,H:
拒绝域D=(t,+)
(4)H:,H:
拒绝域D=(t,+)
2.双正态总体N(,) N(在假使方差条件下
检验H0:, H1:
构造t统计量t= ~t(n1-n2)
其中 特别n1=n2时
可以推广至检验 此时将t统计量分子换成
给定显著性水平 确定拒绝域
=
查t-分布表 拒绝域D=
求子样观测值的t-值,判断t与否
P319例7.4(略)
三.X2-检验
单个正态总 有关方差假使检验
均值已知
双边检验
H0: H1=
构造x2统计量 ~x2(n)
③给定,确定拒绝域c 使
由于c的结构形式为
即 且
为了计算方便,取
查x2-分布表知,上侧分位点 使
使
拒绝域c
类似地,可给出单边检验的拒绝域
(1)H0: H1:
欲拒绝H0,即接受H1, Sn2/必过分地大
x2=nSn2/必过分地大,又由于E x2=n
x2远离n的可能性较小
即
确立临界值
拒绝域
(2)H0: , H1:
查x2-分布表:临界值
拒绝域
3.2 均值未知
此时构造x2统计量 ~x2(1-n)
类似地确定双边检验:临界值 ,
临界域
单边检验:临界值 或
例7.5.P322
四.F-检验
双正态总体
4.1 均值已知, ①。
② ~ F(n1,n2)
③给定 确定临界域
双边检验:
至于也可利用F-分布的性质
=1/ 特别地 n1=n2时 两者互为倒数
4.2 均值未知
双边检验:①。
构造F= ~ F(n1-1,n2-1)
其中
给定显著性水平,类似地运用F-分布表确定临界点
§7.3 正态总体参数的置信区间
置信区间.
设总体具有概率函数f(x,),为未知参数,为取定这个总体的字样,若对于两个统计量 使
则称区间为参数的置信度为1-的置信区间 ,称为置信下限,称为置信上限
注:①置信区间是一个随机区间,它的两端点是不依赖为的统计量
②其意义指在重复抽样下,许多不同的置信区间中大约100(1-%的区间包含未知参数
即包含的区间类的置信度,不能认为不等式成立的概率为1-
一 正态总体值的区间估计
已知σ=σ,则μ的置信水平1-的置信区间是
(-,+) 其分位点
P(〈〉=1-
即P(-〈〈〉=1-
P(-〈(-)/(/)〈〉=1-
P(-〈〈+〉=1-
未知σ=σ,则μ的置信水平1-的置信区间是
(-t(n-1), +t(n-1))
由于 P(- t(n-1) 〈 (-)/(/)〈 t(n-1)〉=1-
二 正态总体方差的区间估计
(1)已知 =,则的置信水平为1-的置信区间为
(,)
由P(〈=〈〉可得
(2)未知 ,置信水平1-的置信区间
[,]
由 P(〈〈〉
=1-
三 双正态总体的区间估计
1 均值差-的区间估计
(1)已知及,则-的置信水平为1-的置信区间是
( --,-+)
由P(〈=〈〉 =1-
(2)未知及,但假定=,则-的置信水平为1-的置信区间是
(--St(n+n-2),--St(n+n-2))
由于 P(t〈 (-)/(S)〈 t〉=1-
2 方差比的区间估计
(1),已知,的置信区间为
[,]
由P(F〈F=〈F〉=1-
(2),未知