第四节 大数定理与中心极限定理
概率论与数理统计是研究随机现象统计规律性的学科,而随机现象的规律性在相同的条件下进行大量重复试验时会呈现某种稳定性,例如,大量的抛掷硬币的随机试验中,正面出现频率; 在大量文字资料中,字母使用频率; 工厂大量生产某种产品过程中,产品的废品率等,一般地,要从随机现象中去寻求事件内在的必然规律,就要研究大量随机现象的问题.
在生产实践中,人们还认识到大量试验数据、测量数据的算术平均值也具有稳定性,这种稳定性就是我们将要讨论的大数定律的客观背景,在这一节中,我们将介绍有关随机变量序列的最基本的两类极限定理----大数定理和中心极限定理.
分布图示
★大数定理的引入
★切比雪夫不等式
★例1 ★例2
★大数定理 ★推论大数定理
★中心极限定理的引入
★林德伯格—勒维定理 ★棣莫佛—拉普拉斯定理
★例3 ★例4 ★例5
★例6 ★例7 ★例8
★高尔顿钉板试验中心极限定理
★内容小结 ★课堂练习
★习题4-4
★返回
内容要点一、切比雪夫不等式定理2设随机变量有期望和方差,则对于任给,有
,
上述不等式称切比雪夫不等式.
注:(i) 由切比雪夫不等式可以看出,若越小,则事件
的概率越大,即,随机变量集中在期望附近的可能性越大,由此可见方差刻划了随机变量取值的离散程度.
(ii) 当方差已知时,切比雪夫不等式给出了与它的期望的偏差不小于的概率的估计式.如取 则有
故对任给的分布,只要期望和方差存在,则随机变量取值偏离超过的概率小于0.111.
二、大数定理
1.切比雪夫大数定律定理3 (切比雪夫大数定律)设是两两不相关的随机变量序列,它们数学期望和方差均存在,且方差有共同的上界,即 则对任意,有
注,定理表明,当很大时,随机变量序列的算术平均值依概率收敛于其数学期望,
2.伯努利大数定理定理4 (伯努利大数定律)设是重伯努利试验中事件发生的次数,是事件在每次试验中发生的概率,则对任意的,有
或 .
注:(i) 伯努利大数定律是定理1的推论的一种特例,它表明,当重复试验次数充分大时,事件发生的频率依概率收敛于事件发生的概率.定理以严格的数学形式表达了频率的稳定性,在实际应用中,当试验次数很大时,便可以用事件发生的频率来近似代替事件的概率.
(ii) 如果事件的概率很小,则由伯努利大数定律知事件发生的频率也是很小的,或者说事件很少发生,即“概率很小的随机事件在个别试验中几乎不会发生”,这一原理称为小概率原理,它的实际应用很广泛,但应注意到,小概率事件与不可能事件是有区别的,在多次试验中,小概率事件也可能发生.
三、中心极限定理在实际问题中,许多随机现象是由大量相互独立的随机因素综合影响所形成,其中每一个因素在总的影响中所起的作用是微小的,这类随机变量一般都服从或近似服从正态分布,以一门大炮的射程为例,影响大炮的射程的随机因素包括,大炮炮身结构的制造导致的误差,炮弹及炮弹内炸药在质量上的误差,瞄准时的误差,受风速、风向的干扰而造成的误差等,其中每一种误差造成的影响在总的影响中所起的作用是微小的,并且可以看成是相互独立的,人们关心的是这众多误差因素对大炮射程所造成的总影响,因此需要讨论大量独立随机变量和的问题.
中心极限定理回答了大量独立随机变量和的近似分布问题,其结论表明,当一个量受许多随机因素(主导因素除外) 的共同影响而随机取值,则它的分布就近似服从正态分布.
1.林德伯格—勒维定理定理6 (林德伯格—勒维) 设是独立同分布的随机变量序列,且
则
注,定理6表明,当充分大时,个具有期望和方差的独立同分布的随机变量之和近似服从正态分布,虽然在一般情况下,我们很难求出的分布的确切形式,但当很大时,可求出其近似分布,由定理结论有
故定理又可表述为,均值为,方差的的独立同分布的随机变量的算术平均值,当充分大时近似地服从均值为,方差为的正态分布,这一结果是数理统计中大样本统计推断的理论基础.
2,棣莫佛—拉普拉斯定理在第二章中,作为二项分布的正态近似,我们曾经介绍了棣莫佛—拉普拉斯定理,这里再次给出,并利用上述中心极限定理证明之.
定理7(棣莫佛—拉普拉斯定理)设随机变量服从参数的二项分布,则对任意,有
注,易见,棣莫佛—拉普拉斯定理就是林德伯格—勒维定理的一个特殊情况.
例题选讲
切比雪夫不等式例1 已知正常男性成人血液中,每一毫升白细胞数平均是7300,均方差是700,利用切比雪夫不等式估计每毫升白细胞数在5200~9400之间的概率.
解 设每毫升白细胞数为 依题意,
所求概率为
由切比雪夫不等式
即每毫升白细胞数在5200 ~ 9400之间的概率不小于8/9.
例2 (E01) 在每次试验中,事件发生的概率为0.75,利用切比雪夫不等式求,独立试验次数n最小取何值时,事件出现的频率在0.74~0.76之间的概率至少为0.90?
解 设为次试验中,事件出现的次数,则
,
所求为满足的最小的
可改写为
在切比雪夫不等式中取 则
依题意,取使 解得
即取18750 时,可以使得在次独立重复试验中,事件出现的频率在之间的概率至少为 0.90.
棣莫佛—拉普拉斯定理例3 (E02) 一盒同型号螺丝钉共有100个,已知该型号的螺丝钉的重量是一个随机变量,期望值是100g,标准差是10g,求一盒螺丝钉的重量超过10.2kg的概率.
解 设为第个螺丝钉的重量, 且它们之间独立同分布,
于是一盒螺丝钉的重量为 且由
知 由中心极限定理有
例4 (E03) 计算机在进行数学计算时,遵从四舍五入原则,为简单计,现在对小数点后面第一位进行舍入运算,则误差可以认为服从上的均匀分布,若在一项计算中进行了100次数字计算,求平均误差落在区间上的概率.
解 用表示第次运算中产生的误差,相互独立,都服从上的均匀分布,且,从而
故平均误差落在上的概率为
例5(E04) 某车间有200台车床,在生产期间由于需要检修、调换刀具、变换位置及调换工作等常需停车,设开工率为0.6,并设每台车床的工作是独立的,且在开工时需电力1千瓦,问应供应多少瓦电力就能以99.9%的概率保证该车间不会因供电不足而影响生产?
解 对每台车床的观察作为一次试验,每次试验观察台车床在某时刻是否工作,工作的概率为0.6,共进行200次试验,用表示在某时刻工作着的车床数,依题意,有
现在的问题是,求满足的最小的
由定理3,近似服从 这里
于是
由 查正态分布函数表得故
从中解得 即所求 也就是说,应供应142千瓦电力就能以99.9%的概率保证该车间不会因供电不足而影响生产.
例6(E05) 某市保险公司开办一年人身保险业务,被保险人每年需交付保险费160元,若一年内发生重大人身事故,其本人或家属可获2万元赔金,已知该市人员一年内发生重大人身事故的概率为0.005,现有5000人参加此项保险,问保险公司一年内从此项业务所得到的总收益在20万到40万元之间的概率是多少?
解 记
于是均服从参数为的两点分布,且
是5000个被保险人中一年内发生重大人身事故的人数,保险公司一年内从此项业务所得到的总收益为万元.
于是
.
例7 对于一个学校而言,来参加家长会的家长人数是一个随机变量,设一个学生无家长,1名家长,2名家长来参加会议的概率分别为0.05,0.8,0.15,若学校共有400名学生,设各学生参加会议的家长数相互独立,且服从同一分布,求参加会议的家长数超过450的概率.
解 以记第个学生来参加会议的家长数,则的分布律为
易知 而由定理3,随机变量
故
例8 设有1000人独立行动,每个人能够按时进入掩蔽体的概率为0.9,以95%概率估计,在一次行动中,至少有多少人能够进入掩蔽体.
解 用表示第人能够按时进入掩蔽体,令
设至少有人能进入掩蔽体,则要求
由中心极限定理,有 所以
查正态分布数值表,得 故人.
课堂练习某地有甲、乙两个电影院竞争当地每天的1000名观众,观众选择电影院是独立的和随机的,问,每个电影院至少应设有多少个座位,才能保证观众因缺少座位而离去的概率小于1%?
概率论与数理统计是研究随机现象统计规律性的学科,而随机现象的规律性在相同的条件下进行大量重复试验时会呈现某种稳定性,例如,大量的抛掷硬币的随机试验中,正面出现频率; 在大量文字资料中,字母使用频率; 工厂大量生产某种产品过程中,产品的废品率等,一般地,要从随机现象中去寻求事件内在的必然规律,就要研究大量随机现象的问题.
在生产实践中,人们还认识到大量试验数据、测量数据的算术平均值也具有稳定性,这种稳定性就是我们将要讨论的大数定律的客观背景,在这一节中,我们将介绍有关随机变量序列的最基本的两类极限定理----大数定理和中心极限定理.
分布图示
★大数定理的引入
★切比雪夫不等式
★例1 ★例2
★大数定理 ★推论大数定理
★中心极限定理的引入
★林德伯格—勒维定理 ★棣莫佛—拉普拉斯定理
★例3 ★例4 ★例5
★例6 ★例7 ★例8
★高尔顿钉板试验中心极限定理
★内容小结 ★课堂练习
★习题4-4
★返回
内容要点一、切比雪夫不等式定理2设随机变量有期望和方差,则对于任给,有
,
上述不等式称切比雪夫不等式.
注:(i) 由切比雪夫不等式可以看出,若越小,则事件
的概率越大,即,随机变量集中在期望附近的可能性越大,由此可见方差刻划了随机变量取值的离散程度.
(ii) 当方差已知时,切比雪夫不等式给出了与它的期望的偏差不小于的概率的估计式.如取 则有
故对任给的分布,只要期望和方差存在,则随机变量取值偏离超过的概率小于0.111.
二、大数定理
1.切比雪夫大数定律定理3 (切比雪夫大数定律)设是两两不相关的随机变量序列,它们数学期望和方差均存在,且方差有共同的上界,即 则对任意,有
注,定理表明,当很大时,随机变量序列的算术平均值依概率收敛于其数学期望,
2.伯努利大数定理定理4 (伯努利大数定律)设是重伯努利试验中事件发生的次数,是事件在每次试验中发生的概率,则对任意的,有
或 .
注:(i) 伯努利大数定律是定理1的推论的一种特例,它表明,当重复试验次数充分大时,事件发生的频率依概率收敛于事件发生的概率.定理以严格的数学形式表达了频率的稳定性,在实际应用中,当试验次数很大时,便可以用事件发生的频率来近似代替事件的概率.
(ii) 如果事件的概率很小,则由伯努利大数定律知事件发生的频率也是很小的,或者说事件很少发生,即“概率很小的随机事件在个别试验中几乎不会发生”,这一原理称为小概率原理,它的实际应用很广泛,但应注意到,小概率事件与不可能事件是有区别的,在多次试验中,小概率事件也可能发生.
三、中心极限定理在实际问题中,许多随机现象是由大量相互独立的随机因素综合影响所形成,其中每一个因素在总的影响中所起的作用是微小的,这类随机变量一般都服从或近似服从正态分布,以一门大炮的射程为例,影响大炮的射程的随机因素包括,大炮炮身结构的制造导致的误差,炮弹及炮弹内炸药在质量上的误差,瞄准时的误差,受风速、风向的干扰而造成的误差等,其中每一种误差造成的影响在总的影响中所起的作用是微小的,并且可以看成是相互独立的,人们关心的是这众多误差因素对大炮射程所造成的总影响,因此需要讨论大量独立随机变量和的问题.
中心极限定理回答了大量独立随机变量和的近似分布问题,其结论表明,当一个量受许多随机因素(主导因素除外) 的共同影响而随机取值,则它的分布就近似服从正态分布.
1.林德伯格—勒维定理定理6 (林德伯格—勒维) 设是独立同分布的随机变量序列,且
则
注,定理6表明,当充分大时,个具有期望和方差的独立同分布的随机变量之和近似服从正态分布,虽然在一般情况下,我们很难求出的分布的确切形式,但当很大时,可求出其近似分布,由定理结论有
故定理又可表述为,均值为,方差的的独立同分布的随机变量的算术平均值,当充分大时近似地服从均值为,方差为的正态分布,这一结果是数理统计中大样本统计推断的理论基础.
2,棣莫佛—拉普拉斯定理在第二章中,作为二项分布的正态近似,我们曾经介绍了棣莫佛—拉普拉斯定理,这里再次给出,并利用上述中心极限定理证明之.
定理7(棣莫佛—拉普拉斯定理)设随机变量服从参数的二项分布,则对任意,有
注,易见,棣莫佛—拉普拉斯定理就是林德伯格—勒维定理的一个特殊情况.
例题选讲
切比雪夫不等式例1 已知正常男性成人血液中,每一毫升白细胞数平均是7300,均方差是700,利用切比雪夫不等式估计每毫升白细胞数在5200~9400之间的概率.
解 设每毫升白细胞数为 依题意,
所求概率为
由切比雪夫不等式
即每毫升白细胞数在5200 ~ 9400之间的概率不小于8/9.
例2 (E01) 在每次试验中,事件发生的概率为0.75,利用切比雪夫不等式求,独立试验次数n最小取何值时,事件出现的频率在0.74~0.76之间的概率至少为0.90?
解 设为次试验中,事件出现的次数,则
,
所求为满足的最小的
可改写为
在切比雪夫不等式中取 则
依题意,取使 解得
即取18750 时,可以使得在次独立重复试验中,事件出现的频率在之间的概率至少为 0.90.
棣莫佛—拉普拉斯定理例3 (E02) 一盒同型号螺丝钉共有100个,已知该型号的螺丝钉的重量是一个随机变量,期望值是100g,标准差是10g,求一盒螺丝钉的重量超过10.2kg的概率.
解 设为第个螺丝钉的重量, 且它们之间独立同分布,
于是一盒螺丝钉的重量为 且由
知 由中心极限定理有
例4 (E03) 计算机在进行数学计算时,遵从四舍五入原则,为简单计,现在对小数点后面第一位进行舍入运算,则误差可以认为服从上的均匀分布,若在一项计算中进行了100次数字计算,求平均误差落在区间上的概率.
解 用表示第次运算中产生的误差,相互独立,都服从上的均匀分布,且,从而
故平均误差落在上的概率为
例5(E04) 某车间有200台车床,在生产期间由于需要检修、调换刀具、变换位置及调换工作等常需停车,设开工率为0.6,并设每台车床的工作是独立的,且在开工时需电力1千瓦,问应供应多少瓦电力就能以99.9%的概率保证该车间不会因供电不足而影响生产?
解 对每台车床的观察作为一次试验,每次试验观察台车床在某时刻是否工作,工作的概率为0.6,共进行200次试验,用表示在某时刻工作着的车床数,依题意,有
现在的问题是,求满足的最小的
由定理3,近似服从 这里
于是
由 查正态分布函数表得故
从中解得 即所求 也就是说,应供应142千瓦电力就能以99.9%的概率保证该车间不会因供电不足而影响生产.
例6(E05) 某市保险公司开办一年人身保险业务,被保险人每年需交付保险费160元,若一年内发生重大人身事故,其本人或家属可获2万元赔金,已知该市人员一年内发生重大人身事故的概率为0.005,现有5000人参加此项保险,问保险公司一年内从此项业务所得到的总收益在20万到40万元之间的概率是多少?
解 记
于是均服从参数为的两点分布,且
是5000个被保险人中一年内发生重大人身事故的人数,保险公司一年内从此项业务所得到的总收益为万元.
于是
.
例7 对于一个学校而言,来参加家长会的家长人数是一个随机变量,设一个学生无家长,1名家长,2名家长来参加会议的概率分别为0.05,0.8,0.15,若学校共有400名学生,设各学生参加会议的家长数相互独立,且服从同一分布,求参加会议的家长数超过450的概率.
解 以记第个学生来参加会议的家长数,则的分布律为
易知 而由定理3,随机变量
故
例8 设有1000人独立行动,每个人能够按时进入掩蔽体的概率为0.9,以95%概率估计,在一次行动中,至少有多少人能够进入掩蔽体.
解 用表示第人能够按时进入掩蔽体,令
设至少有人能进入掩蔽体,则要求
由中心极限定理,有 所以
查正态分布数值表,得 故人.
课堂练习某地有甲、乙两个电影院竞争当地每天的1000名观众,观众选择电影院是独立的和随机的,问,每个电影院至少应设有多少个座位,才能保证观众因缺少座位而离去的概率小于1%?