概率模型现实世界的变化受着众多因素的影响,包括确定的和随机的。如果从建模的背景、目的和手段看,主要因素是确定的,随机因素可以忽略,或者随机因素的影响可以简单地以平均值的作用出现,那么就能够建立确定性模型。如果随机因素对研究对象的影响必须考虑,就应建立随机模型。
本章讨论如何用随即变量和概率分布描述随机因素的影响,
建立随机模型 --概率模型。
统计模型如果由于客观事物内部规律的复杂性及人们认识程度的限制,无法分析实际对象内在的因果关系,建立合乎机理规律的模型,那么通常要搜集大量的数据,基于对数据的统计分析建立模型,这就是本章还要讨论的用途非常广泛的一类随机模型 — 统计回归模型。
一 传送系统的效率在机械化生产车间里,排列整齐的工作台旁工人们紧张的生产同一种产品,工作台上放一条传送带在运转,带上设置若干钩子,工人将产品挂在经过他上方的钩子上带走,如图。
当生产进入稳定状态后,每个工人生产一件产品所需时间是不变的,而他挂产品的时刻是随机的。衡量这种传送系统的效率可以看他能否及时把工人的产品带走。在工人数目不变的情况下传送带速度越快,带上钩子越多,效率越高。
要求构造衡量传送系统效率的指标,并在简化假设下建立模型描述这个指标与工人数目、钩子数量等参数的关系。
……
……
传送带挂钩工作台
1 模型分析为了用传送带及时带走的产品数量来表示传送系统的效率,在工人生产周期(即生产一件产品的时间)相同的情况下,需要假设工人生产出一件产品后,要么恰好有空钩子经过工作台,
他可以将产品挂上带走,要么没有空钩子经过,他将产品放下并立即投入下一件产品的生产,以保证整个系统周期性的运转。
工人生产周期相同,但由于各种因素的影响,经过相当长的时间后,他们生产完一件产品的时刻会不一致,
认为是随机的,并在一个生产周期内任一时刻的可能性一样。
由上分析,传送系统长期运转的效率等价于一周期的效率,而一周期的效率可以用它在一周期内能带走的产品数与一周期内生产的全部产品数之比来描述。
2 模型假设
3) 在一周期内有 个钩子通过每一工作台上方,钩子均匀排列,到达第一个工作台上方的钩子都是空的。
m
4) 每个工人在任何时刻都能触到一只钩子,且之能触到一只,在他生产出一件产品的瞬间,如果他能触到的钩子是空的,则可将产品挂上带走;如果非空,则他只能将产品放下。放下的产品就永远退出这个传送系统。
1)有 n 个工人,其生产是独立的,生产周期是常数,
个工作台均匀排列。n
2)生产已进入稳态,即每个工人生产出一件产品的时刻在一个周期内是等可能性的。
3 模型建立将传送系统效率定义为一周期内带走的产品数与生产的全部产品数之比,记作,设带走的产品数为,生产的全部产品数为,则 。需求出 。
D
得到 的步骤如下,(均对一周期而言 )
任一只钩子被一名工人触到的概率是 ;
任一只钩子不被一名工人触到的概率是 ;
由工人生产的独立性,任一只钩子不被所有 个工人挂上产品的概率,即任一只钩子为空钩的概率是 ;
任一只钩子非空的概率是 。
s
n nsD /? s
如果从工人的角度考虑,分析每个工人能将自己的产品挂上钩子的概率,这与工人所在的位置有关(如第 1个工人一定可挂上),这样使问题复杂化。我们从钩子角度考虑,在稳定状态下钩子没有次序,处于同等地位。若能对一周期内的 只钩子求出每只钩子非空的概率,则 。
m
p mps?
p
m/1
m/11?
n
n
m

11
n
mp

111
传送系统的效率指标为



n
mn
m
n
mpD 111
m n为了得到比较简单的结果,在钩子数 相对于工人数 较大,即 较小的情况下,将多项式 展开后只取前 3
项,则有
m
n n
m

11

m
n
m
nn
m
n
n
mD
2
11
2
111
2





如果将一周期内未带走的产品数与全部产品数之比记作 E
再假定 1n,则
m
nEED
2,1
当 40,10 mn 时,上式给出的结果为 %5.87?D
用 D 的精确表达式计算得 %4.89?D
4 模型评价这个模型是在理想情况下得到的,其中一些假设,如生产周期不变,挂不上钩子的产品退出系统等是不现实的,但模型的意义在于,一方面利用基本合理的假设将问题简化到能够建模的程度,并用简单的方法得到结果;另一方面所得到的简化结果具有非常简单的意义:指标 DE 1
与 n 成正比,与 m 成反比。 通常工人数目 n 是固定的,
一周期内通过的钩子数 增加一倍,可使“效率” 降低一倍。
m E
思考:
如何改进模型使,效率,降低?
(可理解为相反意义的效率)
考虑通过增加钩子数来使效率降低的方法:
在原来放置一只钩子处放置的两只钩子成为一个钩对。一周期内通过 m 个钩对,任一钩对被任意工人触到的概率
mp /1?,不被触到的概率 pq 1,于是任一钩对为空的概率是 nq,钩对上只挂一件产品的概率是 1?nnpq,一周期内通过的 m2 个钩子中,空钩的平均数是12 nn npqqm
带走产品的平均数是122 nn npqqmm
未带走产品的平均数是
122 nn npqqmmn
按照上一模型的定义,有



111112211 nn
mm
n
mn
mDE
n
m

11 和 111

n
m
的近似展开,可得

2
2
2 66
21
m
n
m
nnE
n
m

11 展开取 4项,111?

n
m
展开取 3项。而上一模型中的方法有
m
nE
41?

1EE
m
n
3
2

3
2 nm? 时,1,所以该模型提供的方法比上一个模型好。
注意:
利用二 报童的诀窍问题:
报童每天清晨从报社购进报纸零售,晚上将没有卖掉的报纸退回。设报纸每份的购进价为 b,零售价为 a,退回价为 c,假设 a>b>c。即报童售出一份报纸赚 a-b,退回一份赔 b-c。报童每天购进报纸太多,卖不完会赔钱;购进太少,不够卖会少挣钱。
试为报童筹划一下每天购进报纸的数量,以获得最大收入。
模型分析:
购进量由需求量确定,需求量是随机的。假定报童已通过自己的经验或其他渠道掌握了需求量的随机规律,即在他的销受范围内每天报纸的需求量为 份的概率是rrf,2,1,0?r
有了 和rf cba,,就可以建立关于购进量的优化模型。
模型建立:
假设每天购进量是 n 份,需求量 r 是随机的,r 可以小于,等于或大于 n,所以报童每天的收入也是随机的。那么,作为优化模型的目标函数,不能取每天的收入,而取长期卖报(月,年)
的日平均收入。从概率论大数定律的观点看,这相当于报童每天收入的期望值,简称平均收入。
记报童每天购进 n 份报纸的平均收入为nG,如果这天的需求量 nr?,则售出 r 份,退回 rn? 份;如果需求量 nr?
则 n 份将全部售出。需求量为 r 的概率是rf,则



n
r nr
rnfbarfrncbrbanG
0 1
问题归结为在 cbarf,,,已知时,求 n 使nG 最大。
模型求解:
n drrpcbnnpbadndG 0
通常需求量
r
和购进量 n 都相当大,将 r 视为连续变量便于分析和计算,这时概率rf 转化为概率密度函数rp
n n drrnpbadrrprncbrbanG 0
计算

drrpbadrrpcb
drrpbannpba
n
n
n



0
则令使报童日平均收入达到最大的购进量
0?dndG
,得到
cb
ba
drrp
drrp
n
n
0
n 应满足上式。
因为
ca badrrpn
0
10 drrp,所以根据需求量的概率密度rp 的图形可以确定购进量 n
在图中用 21,PP 分别表示曲线rp
下的两块面积,则
cb
ba
P
P

2
1
rp
O n r
1P 2P
因为当购进超过
n 份报纸时,drrpP n
01
是需求量 r 不超过
n 的概率,即卖不完的概率;
drrpP n2
是需求量 r
n 的概率,即卖完的概率,所以上式表明,购进的份数
n 应该使卖不完与卖完的概率之比,恰好等于卖出一份赚的钱
ba?
与退回一份赔的钱
cb? 之比。
结论:
当报童与报社签订的合同使报童每份赚钱与赔钱之比约大时,
报童购进的份数就应该越多。
练习:
利用上述模型计算,若每份报纸的购进价为 0.75元,售出价为
1元,退回价为 0.6元,需求量服从均值 500份,均方差 50份的正态分布,报童每天应购进多少份报纸才能使平均收入最高,
最高收入是多少?