审讯过程的数学模型
倪致祥 主讲
审讯过程的数学模型
引言
基本模型
讯问策略一
讯问策略二
讯问策略三
综合讯问策略
结论
引言
审讯过程是侦察刑事犯罪案件中的一个重要环
节,它对侦破案件、确认犯罪事实具有重要作
用。
实际的审讯过程涉及的因素多,非常复杂,我
们如何建立一个实用的数学模型呢?
首先我们应该把各种可能的因素都罗列出来,
分析一下那些是主要的因素,然后抓住主要因
素来建立一个简化的基本模型。
对基本模型要用实践检验,再加以修正或完善。
下面我们就来建立审讯过程的数学模型。
基本模型
审讯过程可以看成讯问人(公安检察人员)和
被讯问人(犯罪嫌疑人)的对策过程。
为了简单起见,这里我们把研究的范围限制在
被讯问人单独作案的情况,这时被讯问人组成
一个局中人。
按刑事诉讼法的要求,在审讯中讯问者至少应
为两人;但这几个人是采用同一共同策略的,
因此从对策论的观点来看,讯问者也只能算作
一个局中人。
基本模型
按上面的分析,单独作案的审讯过程可以归结
为有二个局中人的二人对策问题。
一般情况下,被讯问人往往企图想方设法来减
轻自己的刑事责任;而讯问人的目的是通过审
讯尽可能地掌握案情事实,并非只是为了给被
讯问人多判几年。因此两者的关系并不是完全
对立的。
由于两个局中人不象在博弈过程中那样完全对
立,因此它不同于常见的二人常和对策问题,
不能套用已知的矩阵对策的方法和结果,必须
另辟蹊径,建立新的数学模型来分析处理。
基本模型
假定被讯问人的实际犯
罪量为 A,它可用法定
的刑期或罚金来定量化。
为简单起见,我们把被
讯问人的策略集概括为
不交代,交代;而对被
讯问人的犯罪事实,讯
问人有掌握和不掌握二
种情况。
由此我们可以得到被讯
问人的基本支付表(支
付矩阵)如右表:
支付表一
支付值 不掌握 掌 握
不交代 0 A
交 代 A A
基本模型
? 考虑到通常讯问人仅掌
握部分犯罪事实,而被
讯问人也可能采取部分
交代的策略,我们必须
用统计的办法来描述。
? 假设讯问人对被讯问人
的犯罪事实的掌握程度
为 p,当完全不掌握时
p = 0,完全掌握时 p =
1,一般情况下 0 < p <
1 。
支付表一
支付值 不掌握
1-p
掌 握
p
不交代
1-q
0 A
交 代
q
A A
基本模型
同时假设被讯问人对问
题的交代程度为 q,当
完全不交代时 q = 0,
完全交代时 q = 1,一
般情况下 0 < q < 1 。
因此当被讯问人采用策
略 q,即交代程度为 q
时其支付的期待值为
f = q A + ( 1 – q) p A
(1)
支付表一
支付值 不掌握
1-p
掌 握
p
不交代
1-q
0 A
交 代
q
A A
基本模型
从经济学的角度看,人类行为的动机可归结为
利益动机:人们在行为决策时通常遵循, 利益
最大化, 或, 支付最小化, 的原则。
因而被讯问人倾向于采取使其支付期待值 f 为
最小的策略。根据 (1)式,我们有
fq = ( 1 – p ) A > 0 (2)
故当 q = 0 时基本支付的期待值为最小,即被
讯问人有隐瞒罪行的自然倾向,这与我们的经
验是一致的。
基本模型
另一方面,讯问人的目标是使被讯问人的交待
程度 q 为最大,即设法使被讯问人采用 q 值较
大的策略。显然,这是一种特殊的二人对策问
题。
由于在此问题中二个局中人的利益不象二人零
和对策中那样完全对立,因此讯问人可以采用
适当措施来调整被讯问人的支付表,改变支付
期待值的最小值点,从而达到让被讯问人交代
的目标。
讯问策略一
经认真观察,我们不难注意到掌握不掌握被讯
问人的犯罪事实是由客观因素决定的,并不是
讯问人主观上可以自由选取的策略。因此基本
支付表中并没有反映出讯问人策略选取的影响。
考虑到我国的基本刑事政策是, 惩办与宽大相
结合,,讯问人首先可以采取的一个策略是
,坦白从宽、抗拒从严, 。
这个策略怎样用数学的方法来表述呢?
讯问策略一
为了便于数学处理,我
们引入宽严系数 a:
一个犯罪量为 A 的被讯
问人如主动交代,则其
支付值可以从宽到 (1-
a)A ;如抗拒交代,则
其支付值可以从严到 (1
+ a)A 。
此策略后,被讯问人的
支付表为表二
容易看出支付表一为表
二中取 a = 0 的特例。
支付表二
支付值 不掌握
1 - p
掌 握
p
不交代
1 – q
0 (1+a)A
交 代
q
(1-a)A (1-a)A
讯问策略一
在讯问人采用宽严策略
后,被讯问人的支付期
待值为
f=q(1-a)A+(1-q)p(1+a)A
(3)
平均支付值 f 随被讯问
人的策略 q 变化的规律

fq =(1-a)A-p(1+a)A
(4)
支付表二
支付值 不掌握
1 - p
掌 握
p
不交代
1 – q
0 (1+a)A
交 代
q
(1-a)A (1-a)A
讯问策略一
fq =(1-a)A-p(1+a)A (4)
定义满足条件 fq = 0 的掌握程度为 pc,由 (4)
式可得
pc = (1 – a)/(1 + a) (5)
当 p > pc 时 f(q) 为减函数,在 q = 1 处取最小
值;
反之当 p < pc 时 f(q) 为增函数,在 q = 0 处取
最小值。
讯问策略一
上面的分析说明 pc 是被讯问人由不交代转变
为交代的临界值,它完全由讯问人所采取的策
略即宽严系数 a 所决定,随着 a 的增加而变小。
对于给定的掌握程度 p,临界值 pc 变小有助于
使被讯问人交代。
例如当 a = 0.1 时,pc = 9/11,因此只有掌握
程度 p 大于 9/11 时被讯问人才会主动交代;
而当 a = 0.2 时,pc = 2/3,只要掌握程度 p
大于 2/3 即可出现主动交代。
讯问策略一
刚才的讨论充分显示了宽严策略对审讯结果的
作用,这在相当程度上与事实相符。
然而实际应用中 a 的大小受到严格限制,有一
个上限。
坦白从宽不是宽大无边,我们总不能因为一个
杀人犯主动坦白而将他无罪释放。
如果当宽严系数 a 取上限时,掌握程度 p 仍小
于临界值 pc,这时要想让被讯问人坦白,必
须另想办法。
讯问策略二
信息经济学告诉我们:信息具有不对称性和不
完全性。
对于审讯过程来说,讯问人不完全了解被讯问
人的实际犯罪量 A ;同时被讯问人也不完全了
解讯问人的掌握程度 p 。
实际上被讯问人在用支付表二来作决策时所依
据的只是他对讯问人掌握程度的估计值 p’,
而不是实际值 p 。我们把估计值对实际值之比
称为失真程度,记为 k,因此有
p’ = k p (6)
讯问策略二
一般来说,失真程度 k 的大小由信息的发送方
式和接受方式共同决定,它可以等于 1(不失
真情况),也可能小于 1 或大于 1,在特殊情况
下,k 的值可以变得很小或者很大。
空城计中诸葛亮只有二千五百人马,却吓跑了
司马懿的十五万大军,这是由于诸葛亮的妙计
使司马懿对蜀军实力估计的失真程度非常大。
由表二,考虑失真后被讯问人对支付期待值的
估计值为
f = q(1-a)A + (1-q)kp(1+a)A (7)
讯问策略二
f = q(1-a)A + (1-q)kp(1+a)A (7)
其导数为
fq = (1-a)A - kp(1+a)A (8)
由条件 fq= 0,可得有失真时的临界掌握程度

pc = (1 – a)/(1 + a)/k (9)
由上式容易看出随着失真程度的增加,临界值
pc在减小,这将促使被讯问人坦白交代。
讯问策略二
上面的分析提示我们:为了达到使被讯问人坦
白交代的目的,讯问人可以采取的第二种策略
是设法加大失真程度的值。
这要求讯问人具有较高的讯问技术。
一个有经验的讯问人常常可以设法使失真程度
的值 k 达到或超过 2,此时如果取 a = 0.2,
则由 (9)式容易求出掌握程度的临界值 1/3,
即实际掌握程度只要大于 1/3 即可让被讯问人
坦白交代。
讯问策略二
当然失真程度 k 也不是越大越好:在一定的掌
握程度 p 下,由于 p’= kp < = 1,因此 k 值存
在一个上限 1/p,失真程度不可能取得很大;
另一方面考虑到 p > pc 是坦白交代的充分条件,
由公式 (8)可得
k >= (1 – a)/(1 + a)/p (10)
k 值也不必取得过大。
由公式 (10)我们发现如果实际掌握程度 p 较大
时,对 k 值的要求可以低一些;但如果 p 不太
大时我们就需要较大的 k 值,即较高的审讯技
术来达到让被讯问人坦白交代的目的。
讯问策略二
然而必须注意到讯问人的第二种策略(扩大失
真程度)只有与第一种策略配合才能起作用;
假如我们单独采用第二种策略,即令 a = 0,
由 (10)式可知这时将要求 k 大于 1/p,而后者
恰好是 k 值的上限。
这个矛盾说明了单独采用第二种策略将得不到
任何效果。
讯问策略三
讯问人可采取的第三种主要策略是对被讯问人
进行思想教育(或感化)。
我们知道犯罪嫌疑人之所以犯罪的原因虽然很
多,但在被拘留或逮捕后仍拒不交代大多数是
因为其坚持个人的立场,只考虑自己的得失,
不愿承担罪责。
站在社会的立场上客观地看,犯罪嫌疑人过去
的犯罪行为已经给社会和他人造成了很大的损
失和伤害,现在拒不交代的做法还将进一步增
加社会为查清真相需用的支付。
讯问策略三
通常这种社会支付随犯
罪量的增加而变大
为简单起见我们假设它
与犯罪量成正比,记为
sA 。社会支付见右表
适当而细致的思想教育
常常能使一些犯罪嫌疑
人幡然悔悟、深刻反省
自己过去的行为,把立
场转变到社会的一边来。
支付表三
社 会
支付值
不掌握
1 - p
掌 握
p
不交代
1 – q
sA sA
交 代
q
0 0
讯问策略三
为了能定量处理,我们引入一个表征经思想教
育后被讯问人立场转变程度的量 ——立场转化
率,记为 r 。
r = 0 表示立场无转化,而 r = 1 表示立场完
全转化到社会一边。
当讯问人单独使用思想教育,即第三种策略时,
被讯问人支付的期待值应为其站在个人立场上
的支付值与站在社会立场上的支付值的加权平
均,权重为立场转化率 r,即
f = (1-r)[qA+(1-q)pA] + r(1-q)sA (11)
讯问策略三
变化率为
fq = (1-r)(1-p)A - rsA (12)
由此可得临界掌握程度为
pc = 1 – rs/(1-r) (13)
显然 pc 随着 r 值的增加而迅速减小,这说明
讯问人可以通过采用思想教育的策略,使被讯
问人转变立场,从而达到使被讯问人坦白交待
的目的。
综合讯问策略
如果我们同时采用上述三种策略,被讯问人的
支付期待值将成为
(14)
其变化率为
(15)
由条件 fq = 0,可得临界掌握程度为
(16)
显然 (16)式中 pc 的值小于公式 (5),(9)和 (13)
中的值,这表明在一般情况下讯问人如能综合
使用三种策略将会得到最好的审讯效果。
结论
按照上面对审讯过程中讯问人的三种主要策略
及其对审讯结果的效用的研究,我们发现坦白
从宽、抗拒从严和思想教育这两种策略均可以
单独运用于审讯过程中,可以认为是基本策略。
而增大被讯问人估计失真程度的策略如单独运
用并无作用,仅当其与两种基本策略配合作用
时才能取得明显效果,因而是辅助策略。
这些结论与审讯过程的实践基本一致,说明了
我们所建立的审讯模型基本正确,能够定量地
反映出审讯过程的本质
结论
当然在实际中被讯问人并不是抽象的, 经济
人,,严格地说经济学的原理不完全适用。
我们在建立模型时略去了许多次要因素,所得
的结果虽在原则上是正确的,但对于具体的审
讯过程只有参考意义。
请同学们想一想,如果犯罪嫌疑人不是单独作
案,我们的模型应该如何发展?