第六讲 随机变量定义和离散型随机变量
重点:随机变量、分布函数的概念,离散型随机变量分布律、常见的离散型随机变量的分布律。
难点:随机变量、离散型随机变量分布律。
一、随机变量和分布函数
1.随机变量的概念
基本事件有的是数量性质的,有的不是数量性质,为了更全面,更深入地研究随机现象,需把试验结果数量化,即在基本事件与数之间建立一种对应关系,我们称这种对应关系为随机变量。
定义1 设E是随机试验,Ω是其样本空间,如果对于每一个ω∈Ω,有一个确定的实数X(ω)=x与之对应,则称X(ω)为随机变量。

图1
用大写字母X,Y,Z等表示随机变量,它们的取值用相应的小写字母x,y,z表示。随机变量的对应关系见图1。
例 1 将一枚硬币连抛两次,用H,T分别表示正面朝上、反面朝上,其样本空间为
,
用X表示出现正面的次数,则X(TT)=0,X(HT)=X(TH)=1,X(HH)=2.显然X为一随机变量。我们可以通过随机变量来描述Ω中的随机事件,如{X=2}表示“出现两次正面”这一事件,{X≤1}表示“出现了一次或没有出现正面”这一事件,显然有{X≤1}={X=0}+{X=1}
注1随机变量与普通随机变量不同。它是定义在样本空间上的实单值函数,它是由随机试验的结果所决定的量,试验前无法预知取何值,但取值的可能性大小有确定的统计规律性。
注2{X≤x}={ω|X(ω)≤x}表示使得随机变量的取值小于或等于x的那些基本事所组成的随机事件,从而有相应的概率,如例1中,

进一步{X∈S}表示所有使得X(ω)∈S的ω所组成的事件,有确定的概率。
2.分布函数
由于随机变量的所有可能取值不一定能一一列举出来,如用随机变量X表示电视机的寿命时,X的取值为全体正实数,因此,为了研究随机变量取值的概率规律,需研究随机变量的取值落在某个区间 (x1,x2]的概率。由

可知,对任意给定的实数x,事件{X≤x}的概率确定了,概率P{x1<X≤x2}也就确定了,而概率P{X≤x}随着x的变化而变化,它是x的函数,我们称之为随机变量X的分布函数。
定义2 设X是一个随机变量,对任意的x∈R,称函数

为随机变量X的分布函数。
分布函数是一普通函数,它的定义域是整个实数轴,如将X看成是实数轴上随机点的坐标,
F(x)在点x处的函数值就表示随机点落在的区间上的概率。
对于任意实数x1,x2( x1< x2)

因此,若已知随机变量X的分布函数,就知道落在区间(x1,x2]上的概率,这样,分布函数就能完整地描述随机变量地统计规律。
分布函数性质:

(2) F(x)是x的不减函数,即若x1< x2,则F(x1)≤ F(x2);

(4) F(x)关于x是右连续的。
反之具有上述性质的实函数,必是某一随机变量的分布函数,所以上述性质称为分布函数的充分必要性质。
注 若定义F(x)= P{X<x},则F(x)是关于x是左连续的,对于连续型随机变量二者相同,对离散型随机变量二者区别很大。
二、离散型随机变量
1.离散型随机变量及其分布律
定义3 若随机变量X可能取值的数目是有限个或可列无限个,则称X是离散型随机变量。X的可能值可写成x1,x2,…,xk,…在有限的情形,这个序列至某一项结束。
对于离散型随机变量,我们感兴趣的是它的可能取值是什么和X以多大概率取每一个值。为此,我们定义定义4 若离散型随机变量X的取值为xk (k=1,2,…)的概率为

则称{pk,k=1,2,…}为离散型随机变量X的概率分布或分布律。分布律也可写成下列的表格形式:



…

…



…

…
由概率的定义,{pk,k=1,2,…}必须满足下列两个条件:
(1)
(2)
由概率的可加性知,X的分布函数为
。
因此离散型随机变量X的分布函数F(x)为右连续单调不减的阶梯函数,并且在 处发生跳跃,跳跃值为pk.
例2 设随机变量所有可能的取值为1,2,…,n,且已知概率P{X=k}与k成正比,即P{X=k}=ak,k=1,2,…n,求常数a的值。

。
例 3 设某射手的命中率为p(0<p<1),现令其对目标进行射击直到射中目标为止,求射击次数X的分布律。
解题思路:要求随机变量的分布律,首先确定随机变量可能取值,然后再确定取这些值的概率。
解:由题意可知X可能取到1,2,…,所有的正整数,并且事件{X=k}表示前k-1次均未击中,第k次才击中目标,故

从而X的分布律为



…

…



…

…
例 4 设一个口袋中装有标号为1,2,2,3,3,3数字的六个球,从这口袋中任取一个球,用随机变量X表示取得的球上标有的数字,求X的分布律和分布函数,并求P{X≤7/2}、P{0.5≤X≤2}.
解 随机变量X的可能取值为1,2,3,由古典概率知识可得
,,。
所以X的分布律为



3

1/6
2/6
3/6
当x <1时,{X≤x}为不可能事件,所以F(x)=0;
当1≤x <2时,{X≤x}等价于,所以F(x)=1/6;
当2≤x <3时,{X≤x}={X=1}+{X=2 },所以F(x)=1/6+2/6=3/6;
当x ≥3时,{X≤x}是必然事件,F(x)=1。

分布函数F(x)的图像如图2所示。
图2


2.几种常见的离散型随机变量的概率分布
1)两点分布或(0-1)分布若在一次随机试验中随机变量X只能取0或1两个值,且它的分布律为P{X=1 }= p,P{X=0 }= 1-p =q,则称随机变量X服从两点分布或分布。
两点分布可以作为描述试验只有两个基本事件的数学模型。如果一个试验只关心某事件A发生或其对立事件发生的情况,就可用服从(0-1)分布的随机变量来描述。
2)二项分布在n重贝努利试验中,若事件A在每次试验中发生的概率均为p,即P(A)=p,则A恰好发生k次(k=0,1,…,n)的概率为。令X表示n重贝努利试验中事件A发生的次数,X是一个随机变量,它的可能取值为0,1,…,n,其分布律为
。
称X服从参数为n,p的二项分布,记作X~B(n,p).
容易看出,当n=1时,二项分布就是(0-1)分布,因而(0-1)分布是二项分布的特殊情况。
二项分布是一类非常重要的分布,它用于描述n重贝努利试验中,A恰好发生k次的概率这种数学模型。
例5 已知一批产品中的次品率为0.01。今从产品中任取10件,求取得的产品中至少有两件次品的概率。
解,令X表示取出的10件产品中的次品数,据题意可知X~B(10,0.01),且事件“取得的产品中至少有2件次品”可表示为{X≥2},所以

例6 设飞机在飞行中每个引擎的故障概率为1-p,且各引擎是否发生故障是相互独立的。当50%及50%以上引擎在正常工作时,飞机可以正常飞行,问对多大的而言,4引擎飞机比2引擎飞机更可靠?
解:令X表示4引擎飞机上正常运行的引擎个数,事件“4引擎飞机正常飞行”可表示为{X≥2},且P{ X≥2}=6p2(1-p)2+4p3(1-p)+p4.
令Y表示2引擎飞机正常运行的引擎个数,则P{ Y≥1}= 1-P{ Y=0}=2p-p2.
要使4引擎飞机比2引擎飞机更可靠,则需要P{ X≥2}> P{ Y≥1},即

由此可得:p>2/3.
二项分布具有以下性质:
(1)对固定的n,p,X取到k的概率随k的增大而增大,直至达到最大值,然后下降。
(2)对于固定的p,随着n的增大,B(n,p).的图形趋于对称。

由上式可知,若(n+1)p为整数,则当k=(n+1)p (或(n+1)p –1)时,P{X=k }取得最大值;若(n+1)p不是整数,k=[(n+1)p]时,P{X=k }取得最大值。称使得概率P{X=k }达到最大值的k为二项分布B(n,p).的最可能值,它是n重贝努利试验中事件A最可能出现的次数。
3)泊松(Poisson)分布若随机变量X所有可能取值为一切非负整数,其概率分布为
,
其中λ>0为参数,则称X服从参数为λ的泊松分布,记为X~P(λ)。
泊松分布的应用相当广泛,它可以作为描述大量试验中稀有事件出现次数的概率分布情况的一个数学模型。主要包括以下情况:在任给定一段固定的时间间隔内来到某公共实施要求给予服务的顾客数;
事故、错误、故障及其他灾害性事件数.
泊松分布具备以下性质:
1);
2) 。
泊松分布与二项分布之间存在密切关系,下面不加证明地介绍泊松分布和二项分布的关系定理。
定理1(泊松定理) 设随机变量。若,则有
。
定理说明:若nPn恒等于常数或Pn足够小且n足够大时,有以下近似式成立
。
在实际计算中,如果n≥10,p≤0.1,可用上式作近似计算。如图3

图3
例7 设书中每一页印刷错误的个数服从参数为λ=0.5的泊松分布,求在这一页书上至少有一处印刷错误的概率。
解 令X表示这一页上印刷错误的个数,则X~P(0.5),故
。
例8 设X~B(5000,0.001),求P {X>1}.
解 因n=5000很大,而p=0.001很小,λ=np=5,由泊松定理有

4)几何分布设在一次试验中仅关心事件A发生或不发生,并假定试验重复进行,在每次重复试验中,事件A发生的概率P(A)=p保持不变,则直到事件A首次发生需要的试验次数X是一个随机变量,它的可能取值为1,2,…,且P{ X=k}=(1-p)k-1p,k=1,2,…,称上述的随机变量X服从参数为p的几何分布。
几何分布可用来描述随机试验直到事件首次发生需要的试验次数。
例9 某人投篮命中率为0.4,问首次投中前,未投中次数小于5的概率是多少?
解 设X为首次投中时已投篮的次数,显然X服从参数为0.4的几何分布,即

而事件“首次投中前,未投中次数小于5次”可表示为{X≤5,它们的概率为
。
5)超几何分布设一批产品共件,其中件次品,从中任取件,则此件产品中次品个数X是一个随机变量,它的可能值为,其概率分布为:
。
称X服从参数为的超几何分布。
超几何分布产生于次不放回抽样,在计数抽样试验中是一个重要分布,在质量管理中经常运用。