统计假设 一、教学目的 1检验的基本思想,掌握假设检验的基本步骤,了解假设检验可能产生的两种错误。 2了解单个与两个正态总体的均值与方差的假设检验。 3了解总体分布假设的检验法,检验法,检验法 二、教学重点 1假设检验的基本步骤,检验法 2单个正态总体的均值与方法的假设检验 三、教学难点 1非参数的假设检验 2正态母体总数的置信区间。 3柯尔莫歌洛夫拟合检验检验 §7.1假设检验的基本思想和概念 统计假设:有关未知分布的假设  ①原假设:第一个假设(陈述的否定)  ②备择假设:第二个假设(陈述本身) ?1500 参数假设 :及到未知参数本身的统计假设 非参数假设:未知分布函数的类型或者它的某些特征提出假设 如    计假设问题:在给定备择假设的前提下,对原假设作出判断 。 (1)拒绝 ,则接受 。 (2)接受 ,则拒绝 该法则称为对 的一个检验法则,有时简称检验。 拒绝域(临界域):将子样空间划分为两个互不相交的子集 当子样观测值点则拒绝 当子样观测值点则拒绝 5.假设检验可能发生的两类错误。 1第一类错误(风险)“弃真”:原假设正确,却错误的拒绝  即 2第二类错误(风险)“收伪”:原假设不正确,却错误的接受  即 6.显著性检验问题。 对犯第一类错误加以控制,而不考虑第二类错误。在这一原则下,寻找临界域C只涉及到原假设,不涉及备择假设 7显著性水平 在进行显著性检验时,给定的犯第一类错误概率 二、小概率原理(实用统计原理) 小概率事件在一次实际实验中是不可能发生的。如果在一次实验中,居然发生了,人们宁愿认为该事件的前提条件起了变化(或发生了错误,或人为安排,或属于一种反常现象)。 三、假设检验的一般步骤: 根据问题提出原假设H和备择假设H,要明白根据样本值x,x,…,x去检验什么样的问题。 寻找检验H的合适统计量。 由给定的显著水平,根据统计量的分布,查表定出相应的分位数的值,即临界值。(确定拒绝域) 根据实测的样本值,具体计算出所统计量的值。视此值是否落入拒绝域。做出H是否成立的判断。 作业P1.2.3 §7.2参数假设检验 一、U-检验: 双边检验:设,,…,取自正态母体N(,)的一个样本,为已知常数。 (1)检验假设H: H: (2)构造U统计量 ~N(0,1) (3)给定显著性水平,查正态分布表,使P {}= 即 P{=1- P()=1- 2  上侧分位点 使P()=1- 确定拒绝域D:{(--)(,+)} (4)计算子样的值,判断其是否落入拒绝域。 Eg1。P7.2 2.单边检验 检验假设H:,H: 此时拒绝域确定方法有差别 P{}=为小概率事件 即P{}=   查正态分布表,k= 拒绝域D(-,) 检验H:,H: 确定拒绝域,分两种情况: (I) 拒绝域D(-,) (ii),对于任何样本观测有:   ~N(0,1)  在给定条件下,使P()= 即 由于事件{}{} 所以P()P() 对假设H而言,拒绝域仍为D 验H:,H: 此时拒绝域为D=(,+) 检验H:,H: 拒绝域为D=(,+) 二、t-检验 方差未知,对正态总体N()中参数进行检验 1双边检验 ①H: H: ②构造t统计量 。t=~t(n-1) 其中s=  ,即用子样方差s,替代原来的总体方差 ③给定显著性水平,确定拒绝域 P()=,P()=1- 查t-分布表,自由度取n-1,确定分位点(n-1) 确定拒绝域D=(--t(n-1))(t,+) 1.2 单边检验 H:,H: 拒绝域D=(--t(n-1)) H:,H: 拒绝域D=(--t(n-1)) H:,H: 拒绝域D=(t,+) (4)H:,H: 拒绝域D=(t,+) 2.双正态总体N(,) N(在假使方差条件下 检验H0:, H1: 构造t统计量t= ~t(n1-n2) 其中 特别n1=n2时  可以推广至检验  此时将t统计量分子换成 给定显著性水平 确定拒绝域 = 查t-分布表 拒绝域D= 求子样观测值的t-值,判断t与否 P319例7.4(略) 三.X2-检验 单个正态总 有关方差假使检验 均值已知 双边检验 H0: H1= 构造x2统计量  ~x2(n) ③给定,确定拒绝域c 使 由于c的结构形式为 即  且 为了计算方便,取 查x2-分布表知,上侧分位点 使   使 拒绝域c 类似地,可给出单边检验的拒绝域 (1)H0: H1: 欲拒绝H0,即接受H1, Sn2/必过分地大 x2=nSn2/必过分地大,又由于E x2=n  x2远离n的可能性较小 即  确立临界值 拒绝域 (2)H0: , H1: 查x2-分布表:临界值 拒绝域 3.2 均值未知 此时构造x2统计量  ~x2(1-n) 类似地确定双边检验:临界值 , 临界域 单边检验:临界值 或 例7.5.P322 四.F-检验 双正态总体  4.1 均值已知, ①。  ② ~ F(n1,n2) ③给定 确定临界域 双边检验: 至于也可利用F-分布的性质 =1/ 特别地 n1=n2时 两者互为倒数 4.2 均值未知 双边检验:①。  构造F= ~ F(n1-1,n2-1) 其中   给定显著性水平,类似地运用F-分布表确定临界点 §7.3 正态总体参数的置信区间 置信区间. 设总体具有概率函数f(x,),为未知参数,为取定这个总体的字样,若对于两个统计量  使 则称区间为参数的置信度为1-的置信区间 ,称为置信下限,称为置信上限 注:①置信区间是一个随机区间,它的两端点是不依赖为的统计量 ②其意义指在重复抽样下,许多不同的置信区间中大约100(1-%的区间包含未知参数 即包含的区间类的置信度,不能认为不等式成立的概率为1- 一 正态总体值的区间估计 已知σ=σ,则μ的置信水平1-的置信区间是 (-,+) 其分位点  P(〈〉=1- 即P(-〈〈〉=1- P(-〈(-)/(/)〈〉=1-  P(-〈〈+〉=1- 未知σ=σ,则μ的置信水平1-的置信区间是 (-t(n-1), +t(n-1)) 由于 P(- t(n-1) 〈 (-)/(/)〈 t(n-1)〉=1- 二 正态总体方差的区间估计 (1)已知 =,则的置信水平为1-的置信区间为 (,) 由P(〈=〈〉可得 (2)未知 ,置信水平1-的置信区间 [,] 由 P(〈〈〉 =1-  三 双正态总体的区间估计 1 均值差-的区间估计 (1)已知及,则-的置信水平为1-的置信区间是 ( --,-+) 由P(〈=〈〉 =1- (2)未知及,但假定=,则-的置信水平为1-的置信区间是 (--St(n+n-2),--St(n+n-2)) 由于 P(t〈 (-)/(S)〈 t〉=1- 2 方差比的区间估计 (1),已知,的置信区间为 [,] 由P(F〈F=〈F〉=1- (2),未知