第04心理物理学方法 一、目的要求: 1.掌握测定阈限的三种基本方法; 2.掌握信号检测论的实验方法; 3.掌握制作心理量表的方法。 二、讲授内容: (一)阈限的性质 (二)测定阈限的三种基本方法 (三)信号检测论 (四)心理量表法 引言:什么是心理物理学 定义:就是研究心理量和物理量之间的关系的科学。 物理量是指对身体各感官的刺激;心理量是指各种感觉或主观印象。如: 亮度(物理量)——明度(心理量) 强度(物理量)——响度(心理量) 心理物理学的发展: 心理物理学的先驱是G. T. Fechner(1801-1887)。 Fechner通过对感觉强度与刺激强度之间的数量关系的长期研究,发展出了测量感觉的基本方法。 一百多年来,心理物理学方法不断发展,但它的中心问题仍然是物理量和心理量之间的数量关系的问题。 心理物理学方法所处理的问题大体上可以分为两大类:感觉阈限的测量;阈上感觉的测量,也就是心理量表的制作。 自从本世纪50年代,W. P. Tanner, Jr.和J. A. Swets把信号检测论(signal detection theory,SDT)引入心理学领域以来,又为心理物理学的研究提供了一个新的有力工具。 心理物理学研究的变量介绍: 因变量: 1、只有一个刺激的实验: (1)信号存在或不存在(我看到、我没有看到) (2)直接给出刺激属性(重多少克?) 2、对两种刺激进行比较的实验: (1)判断大小(刺激A和B谁大?) (2)直接估计结果(A是B的几倍?) 自变量:刺激质和量的属性 控制变量:观察者的意愿 一、阈限的性质 著名的实验心理学史专家Edwin G. Boring(1950)认为对内部感受与外部世界之间关系的测量方法的引入,是科学心理学开始的一个标志。 这主要是因为科学家使用心理物理学的方法提出了第一个心理现象的精确定律,尽管这个定律不一定那么完美。 首先,测量感觉是非常困难的,我们不能象测量石头的重量或光的强度那样来测量感觉。 其次,内部判断与作用于感受器的物理量之间并不是完全一对一的。因此,我们必须把物理刺激及其引起的感觉区分开。 感觉阈限的界定 刚刚能引起感觉的最小刺激强度被叫做绝对阈限。 刚刚能引起感觉的最小差别叫做差别阈限。 按照这样的定义,还不能对这两种阈限进行测定。根据实验我们知道,某一特定数值的刺激,在重复作用于感官时,被试有时报告为“无感觉”,有时报告为“有感觉”,有时还报告为“刚刚有一点点感觉”。 人的感受性的这种随机性变化,在每一种感觉道中都能发现。这种随机变化往往与以下几个方面有关: (1)如何测量阈限有关; (2)被试对任务的注意程度及其态度有关; (3)被试的感受性暂时出现不稳定的摇摆有关。不过,这种随机变化的感觉,其次数分配基本上呈常态分布。 因此,根据统计学,可以把那个可以刚刚引起感觉的最小刺激强度以其算术平均数来表示。而这个平均数恰好有50%的实验次数报告为“有感觉”的刺激强度,由此可见,阈限是个统计值。 因而,我们把阈限定义为:有50%的实验次数能引起积极反应的刺激之值;同理,把差别阈限定义为有50%的实验次数能引起差别感觉的那个刺激强度之差。 此定义要比普通心理学的定义具体,也便于操作,故称为阈限的操作定义。 操作定义是由物理学家布里奇曼提出的,他主张一个概念应由测定它的程序来下定义。 操作定义的提出受到心理学家的欢迎。在心理学上,对一个心理现象根据它们的程序下定义就叫操作定义。 具体说,操作定义就是用可感知、度量的事物、时间、现象和方法对变量或指标作出具体的界定。 关于差别阈限 1846年E. H. Weber发表了他关于重量差别阈限的研究,系统地阐明了差别阈限和标准刺激之间的关系。 他指出差别阈限和标准刺激成正比,并且差别阈限和标准刺激的比例是一个常数,通常用 △I/I = k 表示。在这里,△I代表差别阈限,I代表标准刺激强度,k是小于1的常数。K也称作韦伯比例或韦伯分数。 不同感觉道的韦伯分数是不同的。后来,Fechner把这个 关于差别阈限的规律称为韦伯定律(Weber Law)。 韦伯定律的主要贡献 第一,给我们提供了一个比较辨别能力的指标。 第二,可对不同感觉道的感受性进行比较。 二、测定阈限的三种基本方法 我们明确了阈限的操作定义,就能够用心理物理学方法来测定阈限。关于测定阈限的实验,一般具有下列三个明显的特点: ①选择好刺激系列和反应系列 ②要尽量简化被试对刺激所作的反应 ③测定的次数要多些 1、最小变化法 又叫极限法、最小可觉差法,是测量阈限的直接方法; 最小变化法的刺激由递减和递增的两个系列组成; 每次呈现刺激后让被试报告他是否有感觉; 刺激的增减应尽可能地小,目的是系统地探求被试由一类反应到另一类反应的转折点,即在多强刺激时,由有感觉变为无感觉,或由无感觉变为有感觉。每个系列的转折点就是该系列的绝对阈限。 用最小变化法测定绝对阈限 (1)自变量 用极限法测定绝对阈限,自变量是刺激系列。 刺激系列要按递增或递减系列交替呈现。 递增时,刺激要从阈限以下的某个强度开始; 递减时,刺激系列的起点要大于阈限的某个强度; 一般应选10到20个强度水平。 为了使测定的阈限准确,并使每一刺激系列的阈限能相对稳定,一般递增和递减刺激系列要分别测定50次左右(共100 次左右)、刺激应由实验者操纵。 为了避免被试者形成定势,每次呈现刺激的起点不应固定不变,而应随机变化。 (2)因变量(反应变量) 用极限法测定绝对阈限的反应变量时,要求被试以口头报告方式表示。 当刺激呈现之后,被试感觉到有刺激,就报告“有”,当被试没感觉到有刺激,就报告“无”,其依据是被试的内省,而不是刺激是否呈现。 被试报告后,主试以“有”“无”或“+”“-”记录被试的反应,每个系列都需要被试作“有”到“无”、或“无”到“有”这两种报告,亦即,递增时直到第一次报告“有”之后,这一系列才停止;递减时直到第一次报告“无”之后,这一系列才停止,然后再进行下一个系列。 若被试者在这二类判断中有“说不准”的情况,则可以猜,但不可放弃。 (3)阈限的确定(计算) 在一个刺激系列中,被试者报告“有”和“无”这两个报告相应的两个刺激强度的中点就是这个系列的阈限。 下表是用最小变化法测音高的感觉阈限。 (4)误差及其控制 用极限法求绝对阈限经常会产生一些误差。 在这些误差中,有些是由直接对感觉产生干扰的因素引起的;还有些是非感觉方面的因素引起的,如习惯和期望、练习和疲劳、时间和空间等等。 这些因素在测定阈限的过程中经常起作用,以致使测定结果产生一定倾向的误差。这类误差叫做常误(constant error)。 极限法测定绝对阈限产生的误差主要有四种:习惯误差和期望误差、练习误差和疲劳误差。 在极限法实验中,由于刺激是按一定的顺序呈现的,被试在长序列中有继续给同一种判断的倾向,如在下降序列中继续说“有”或“是”,在上升序列中继续说“无”或“否”,这种被试习惯于前面几次刺激所引起的感觉叫作习惯误差。 由于习惯误差在递增法序列中,即使刺激强度早已超出阈限,被试仍报告感觉不到,这就会使测得阈值偏高 。 相反,在递减法序列中,即使刺激强度早已小于阈限,被试仍报告有感觉,这就会使测得的阈值偏低。 与习惯误差相反的是另一种误差叫期望误差(error of anticipation)。它表现为被试在长的序列中给予相反判断的倾向,期望转折点的尽快到来。用递增法测定时,阈值就会偏低;用递减法测定时,阈值就会偏高。 递增递减系列中的习惯误差。 怎样消除习惯误差和期望误差? 采用抵消平衡设计(即ABBA设计): 第一次:递增(A) 第二次:递减(B) 第三次:递减(B) 第四次:递增(A) 练习误差和疲劳误差 练习误差(error of practice)是由于实验的多次重复,被试逐渐熟悉了实验情景,对实验产生了兴趣和学习效果,而导致反应速度加快和准确性逐步提高的一种系统误差。 与此相反,由于实验多次重复,随着实验进程而发展的疲倦或厌烦情绪的影响,而导致被试反应速度减慢和准确性逐步降低的一种系统误差,称之为疲劳误差(error of fatigue)。 随着时间的进展,练习可能使阈限降低,而疲劳可能使阈限升高。 误差计算 习惯误差和期望误差哪一种倾向更大? 分别求上升序列和下降序列的阈值 练习误差和疲劳误差哪一种倾向更大? 分别计算出前一半实验中测定的阈限与后一半实验中测定的阈限,。 用最小变化法测定差别阈限 (1)自变量 用极限法测定差别阈限时,每次要呈现两个刺激,让被试比较,其中一个是标准刺激,即刺激是固定的,其强度大小不变;另一个是比较刺激又称变异刺激,即刺激的强度按由小而大或由大而小顺序排列。 标准刺激和比较刺激可同时呈现,标准刺激在每次比较时都出现,比较刺激按递增或递减系列,以测定绝对阈限的同样方法与标准刺激匹配呈现。 (2)因变量(反应变量) 用极限法测定差别阈限的反应变量要求被试以口头报告方式表示,一般用三类反应,将比较刺激与标准刺激加以比较,当比较刺激大于标准刺激时,主试记录“+”;当比较刺激等于标准刺激时,主试记录“=”;当比较刺激小于标准刺激时,主试记录“-”。当被试在比较时表示怀疑,可记作“?” 。 (3)差别阈限的确定 确定差别阈限时先要求得一系列的数据,这些数据有: ①在递减系列中最后一次“+”到非“+” 之间的中点为差别阈限的上限 ;第一次非“-”到“-” 之间的中点为差别阈限的下限 ; ②在递增系列中最后依次“-”到非“-” 之间的中点为差别阈限的下限;第一次非“+”到“+”之间的中点为差别阈限的上限。 ③在上限与下限之间的距离为不肯定间距。 ④不肯定间距的中点是主观相等点。在理论上主观相等点(或主观等点)应与标准刺激相等,但实际上两者有一定的差距,这个差距称为常误。 ⑤取不肯定间距的一半或者取上差别阈和下差别阈之和的一半为差别阈限。 (4)误差及其控制 与用极限法求绝对阈限一样,在测定差别阈限时,也必须想方设法控制常误。 除了要控制习惯和期望误差外,还要控制因标准刺激和比较刺激同时呈现所造成的误差(空间误差)或者因先后呈现所造成的(顺序误差)。 控制方法可采用多层次的ABBA法。 多层ABBA法 最小变化法的变式——阶梯法 最小变化法是按一定的梯级增加或减少刺激强度来测定阈限的,并且渐增系列和渐减系列是完全分开的。 阶梯法和最小变化法不同的地方,就在于它把增加和减少刺激强度的程序连续进行。当被试报告感觉不到开始呈现的刺激时,主试就按一定梯级来增加刺激强度;而当增加到被试感觉到了时,又按一定的梯级来减少刺激强度。实验按这样的顺序继续下去,直至达到一个先定的标准或先定的实验次数为止。 2.恒定刺激法 恒定刺激法(或固定刺激法)又叫正误法、次数法,通常由5-7个刺激组成,这几个刺激在实验过程中保持不变。 它是心理物理学中最准确、应用最广的方法,可用于测定绝对阈限、差别阈限和等值,还可用于确定其他很多种心理值。 此法的特点是:根据出现次数来定阈限,即以次数的整个分布求阈限。 恒定刺激法的具体做法: (1)主试从预备实验中选出少数刺激,一般是5到7个,这几个刺激值在整个测定过程中是固定不变的; (2)选定的每种刺激要向被试呈现多次,一般每种刺激呈现50到200次; (3)呈现刺激的次序事先经随机安排,不让被试知道。用以测量绝对阈限,即无需标准值,如用以确定差别阈限或等值,则需包括一个标准值; (4)此法在统计结果时必须求出各个刺激变量引起某种反应(有、无或大、小)的次数。 特别要注意的是,此法在实验之前需要选定刺激。 所选定的刺激最大强度应为每次呈现几乎都能为被试感觉到的强度,它被感觉到的可能性应不低于95%。所选刺激的最小强度应为每次呈现几乎都不能感觉到的强度,它被感觉到的可能性应不高于5%。 选定呈现刺激范围之后,再在这个范围内取距离相等的刺激,每种刺激强度呈现不得少于50次。 用恒定刺激法测定绝对阈限 (1)自变量 用恒定刺激法测定绝对阈限,是从略高于感觉到略低于感觉这一范围内选5到7个等距的刺激强度。 (2)反应变量(因变量) 用恒定刺激法测定绝对阈限的反应变量要求被试者以口头报告方式表示, 在实验中每呈现一次刺激后,被试者若感觉到了,则报告“有”,主试者记录“+”;被试者若感觉不到,则报告“无”,主试者就记录“-”。 然后根据被试者对不同刺激所报告的“有”或“无”的次数来求出百分数,以此来计算阈限。 (3)绝对阈限的计算 a.直线内插法 b.平均Z分数法 c.最小二乘法 a.直线内插法 b.平均Z分数法 PZO转换原理 c.最小二乘法 用恒定刺激法测定差别阈限 (1)自变量 用恒定刺激法测定差别阈限,是让被试者将比较刺激与标准刺激加以比较; 标准刺激是能被感觉到的某一刺激强度; 比较刺激可在标准刺激上下一段距离内确定,一般从完全没被感觉出差别到完全感觉出差别的范围内选定5到7个刺激强度作为比较刺激。 比较刺激要随机呈现,每个比较刺激与标准刺激至少要比100次。 (2)反应变量(因变量) 用恒定刺激法测定差别阈限的反应变量要求被试者以口头报告方式表示: 三类反应: 即“大于”、“等于”和“小于”,分别记为“+”、“=”和“-”。 让被试作三类反应时,因其中有“等于”的反应,若被试较为自信,则作出“等于”的反应就较少;若被试较为谨慎,则作出“等于”的反应就较多。这样会直接影响到差别阈限的大小。(77页) 这种反应易受到被试的态度的影响。 二类反应: 让被试者作“大于”和“小于”两种判断,即使分不清时,也要作出其中的一种判断。 (3)差别阈限的计算 三类反应的差别阈限的计算 相等地带的上限定为50%次重于标准刺激的比较刺激,相等地带的下限定为50%次轻于标准刺激的比较刺激,有了上限、下限,通过前面提到的几种方法就可以计算差别阈限。 二类反应的差别阈限的计算 不能以50%引起感觉差别的刺激增量作为差别阈限; 以75%感觉重于标准刺激的的比较刺激作为相等地带的上限;以25%感觉重于标准刺激的的比较刺激作为相等地带的下限。 3.平均差误法 平均差误法(或均误法)又称调整法、再造法、均等法,是最古老且基本的心理物理学方法之一。 虽然它最适用于测量绝对阈限和等值,但也可用以测量差别阈限。 具体方法 呈现一个标准刺激,令被试再造、复制或调节一个比较刺激,使它与标准刺激相等。比较刺激也可由实验者调节,由被试判断。 调整法曾是过去在天文学上常用的一个方法。那时让观察者调整一个光表面的强度,使之与某星体的亮度相等,这样就可以比较各星体间的亮度。 这个方法是要求被试判断什么时候比较刺激和标准刺激相等。 被试判断为与标准刺激相等的比较刺激,并不总是一个固定的数值,而是围绕着一个平均数变化的一个数。这个变化的范围就是不肯定间距。 不肯定间距的中点就是主观相等点。 通过对主观相等点和不肯定间距的测量,就可以估计差别阈限。 把平均误差作为差别阈限,与差别阈限的定义并不相符,但因为平均误差和差别阈限成正比,所以也作为测量差别感受性的指标。 用平均差误法测定绝对阈限 (1)自变量 用平均差误法测定绝对阈限,是让被试者调整一个比较刺激与一个标准刺激相等。不过,此时的标准刺激假设为零,即让被试者每次将比较刺激与“零”相比较。 (2)因变量(反应变量) 用平均差误法测定绝对阈限的反应变量是被试者每次调整比较刺激与标准刺激相等的那个数值。 (3)绝对阈限的测定(计算) 让被试者每次调到刚刚感觉不到(即与“零”标准刺激等值),然后把各次测定数值加以平均即为绝对阈限。 用平均差误法测定差别阈限 (1)自变量 用平均差误法测定差别阈限,是向被试者呈现一个标准刺激,让其调整比较刺激。比较刺激是一种连续的量。在被试认为接近时,可反复调整,直到其认为满意为止。 (2)因变量(反应变量) 用平均差误法测定差别阈限的反应变量是被试每次调整的数值,即其认为与标准刺激相等的数值。 由于被试反复测试,每次的结果并不是一个固定的数值,它们是围绕着一个平均数变化的数值。这个变化范围就是不肯定间距。 不肯定间距的中点,即多次调整结果的平均数,就是主观相等点,主观相等点与标准刺激的差就是常误。 (3)差别阈限的估计值的计算 用平均差误法求差别阈限,所得差别阈限只是一个估计值,平均差误有两种计算方法: 把每次调节的结果(或每次的判断)与标准刺激之差的绝对值平均起来作为差别阈限。 把每次调节的结果与主观相等点之差的绝对值平均起来作为差别阈限。 测量阈限的三种方法的比较 测量阈限的三种方法各有自己的特点 最小变化法的实验程序和计算过程都具体地说明了感觉阈限的含义,但它会因其渐增和渐减的刺激系列而产生习惯误差与期望误差。 恒定刺激法的实验结果可以应用各种数学方法加以处理,因而便于与其它测定感受性的方法进行比较。在应用3类反应的实验程序时,被试的态度会对差别阈限值有较大影响。 平均差误法的特点是求等值,它的实验程序容易引起被试的兴趣,但对不能连续变化的刺激则不能用平均差误法来测其差别阈限。 三、心理量表法 物理刺激可由物理量表来测量。 但是,心理量的大小却不能用物理量表来测量。 首先,这是因为刺激的物理值的变化不一定会引起心理上相应的一对一的变化。 其次,有一些物理刺激本身就难以用物理量表来测量。 因此,心理量需要用心理量表来测量。 一个量表具有以下四个测量属性: 差别 强度 等距 绝对零点 从量表有无相等单位和有无绝对零点来分,心理量表可分为顺序量表、等距量表和比例量表三类。 (一)顺序量表 顺序量表是一种较粗略的量表,它既无相等单位又无绝对零点,只是把事物按某种标准排出一个次序。 例如赛跑时不用秒表测速,按先到终点的算第一名,第二个到的算第二名等等。这样,我们可以按快慢排出一个顺序,这个顺序在一定程度上也可以表示跑的速度量。因为它没有相等单位,所以就是知道了第二名比第一名慢5秒,也不能以此推算出第三名比第二名慢几秒;又因为它没有绝对零点,所以不能推知第二名的速度是第三名的几倍。 所以,顺序量表只是在一个分类基础上对事物进行分类,每一类别只具有序列性,并不表示数与数之间的差别是相等的。 顺序量表的制作方法 1.等级排列法 等级排列法是一种制作顺序量表的直接方法。这个方法是把许多刺激同时呈现,让许多被试者按照一定标准,把这些刺激排成一个顺序,然后把许多人对同一刺激评定的等级加以平均,这样,就能求出每一刺激的各自平均等级,最后,把各刺激按平均等级排出的顺序就是一个顺序量表。 等级排列法举例 某广告公司要对10张广告的优劣作评比,请来了17名评判者(即被试者)。评判的方法是让被试者将10张广告排成美到丑的一个顺序。通过众多被试者的比较,就可求出全体被试者对同一广告评判的等级的平均值,这个值就是广告的平均等级。各广告按平均等级排出的顺序就是一个顺序量表。 实验结果和具体运算过程 书上189页表4-8上我们可以看清楚等级排列法制作顺序量表的具体过程。 2.对偶比较法 对偶比较法是把所有要比较的刺激配成对,然后一对一对地呈现,让被试者对于刺激的某一特性进行比较,并做出判断:这种特性的两个刺激中哪一个更为明显。因为每一刺激都要分别和其他刺激比较,假如以n代表刺激的总数,所以配成对的个数是n(n-1)/2。如共有10个刺激则可配成45对。最后依它们各自更明显于其他刺激的百分比的大小排列成序,即可制成一个顺序量表。 10对样品呈现次序 如果有五种样品,A、B、C、D、E,则可配成5×(5-1)/2=10对。这10对呈现次序如下表所示。 对偶比较法的两类误差及消除 如果各对样品同时呈现,则要消除空间误差——即样品在空间中不同方位呈现,于判断时产生的误差现象。若第一轮以AB形式呈现,则第二轮中以BA形式呈现即左右颠倒。 如果是相继呈现,则要注意消除时间误差——即相等的二个样品在先后不同时间出现,于判断时产生的误差。若第一轮以先A后B次序相继呈现,则第二轮要按先B后A次序相继呈现。 对偶比较法的数据处理 (二)等距量表 等距量表(equal interval scale)是一种有相等单位但没有绝对零点的量表。等距量表除了其有类别量表和等级量表的性质外,它要求整个量表的各个部分的单位是相等的,但没有绝对的零点。 例如在普通温度上60°和70°的差别与70°和80°的差别是一样的,都是10°。这在量表上单位是等距的。但它的参照点是人定的,这不是绝对的零点。而温度的绝对零点是摄氏零下273℃。因此我们不能说80°是40°的二倍。因为这是不合理的,等距量表没有绝对的零点,只能做加减的运算,不能作乘除的运算。 制作等距量表 的方法 1.感觉等距法 要制作一个等距量表,最直接的方法是采用感觉等距法,它是通过把一个感觉分成主观上相等距离来制作。它要求被试者将某种感觉上的一段心理量分成两个或两个以上的等分。最简单的是二分法。 二分法 例如R1和R5是两个不同响度的声音,且R5>R1。被试者的任务是: (1)找出R3,使其响度正好在R1和R5之间也即R5-R3=R3-R1。 (2)再找出R4,使其响度正好在R3和R5之间,也即R5-R4=R4-R3。 (3)再找出R2,使其响度正好在R1和R3之间,也即R3-R2=R2-R1。 这样,利用三次二分法把R1和R5之间在响度上分成四分,即R5-R4=R4-R3=R3-R2=R2-R1。这就得到了按等距变化的一系列刺激。把这一系列的刺激作为横座标,把等响单位作为纵座标画出一条曲线,这就是响度的等距量表。 2.差别阈限法 差别阈限法(或差异阈限法)是制作等距量表的一种间接方法,通过在不同强度的基础上测量最小可觉差来实现。具体地说,用任何一种古典的心理物理法测出感觉的绝对阈,并以此为起点,产生第一个最小可觉差的刺激强度,以第一个最小可觉差为基准,再测量第二个最小可觉差……。这样测得许多最小可觉差以后,以刺激强度为横坐标,以绝对阈以上的最小可觉差数为纵坐标,画出的心理物理关系图就是等距量表。 (三)比例量表 比例量表(或比率量表)(ratio scale)既有真正的零点,也是等距的。一个比例量表除含有名称、等级这些等距量表的特征外,还有一个具有实际意义的绝对零点。它是测量的最高水平,也是科学家认为理想的量表。若一项测量结果在比例量表上是零,那么,我们可以说某个事物并不具有被测量的属性或特征。由于它具有绝对的零点,且量表上的单位相等,因此就可进行加、减、乘、除四则运算。在物理学中,我们所用的绝对温度量表就属于这类量表。更为熟悉的是公制的尺所采用的量表制度。 在心理测量中,智力的绝对零点是难以决定的,同时,由于等距量表对于大多数心理测量已经足够,所以,我们就不考虑用比例量表作为心理测验的标准化记分量表。但比例量表所适用的统计方法,除上面在等距量表上可采用的统计方法外,还可用几何平均数和相对差异量等计算,所以,对于心理物理学来说,应尽可能使用比例量表。 比例量表的制作方法 1.分段法 分段法是制作感觉比例量表的一种最直接的方法。这个方法是通过把一个感觉量加倍或减半或取任何其他比例来建立心理量表的。 具体作法是呈现一个固定的阈上刺激作为标准,让被试者调整比较刺激,使它所引起的感觉为标准刺激的一定比例,例如,2倍、3倍、1/2倍、或1/3倍等等。每个实验只选定同一个比例进行比较,同一个标准刺激比较若干次后,再换另外几个标准刺激进行比较。如果所选定的比例是2∶1的话,就可找出哪些刺激所引起的感觉为标准刺激所引起的感觉的一半。当把所有的标准刺激都比较完之后,便可用与各标准刺激在感觉上成一定比例的相应的物理量值制成一个感觉比例量表。 听觉响度量表的制作 给被试者一个响度的音,作为标准刺激,让他调节另一个音直到他感觉到比标准刺激的音低—半。用这个方法,以不同的强度音作为标准刺激,让被试调节另一个音直到他感觉到比标准刺激的音低—半。 2.数量估计法 数量估计法也是制作比例量表的一种直接方法。此法的具体步骤是主试者先呈现一个标准刺激,例如,一个重量,并赋予标准刺激一个主观值,例如为10,然后让被试者以这个主观值为标准,把其他不同强度比较刺激的主观值,放在这个标准刺激的主观值的关系中进行判断,并用数字表示出来。然后计算出每组被试者对每个比较刺激量估计的几何平均数或中数,再以刺激值为横坐标,感觉值为纵坐标,即可制成感觉比例量表。 数量估量法的数据处理: 在心理量和物理量关系的实验中,常会出现特别大的数字,所以数量估计法采用的数据处理通常是几何平均值。几何平均值定义为n个数值相乘之积的n次方根。例如,有三个数据:4、8、16,则几何平均数X为: 四、阈限概念和理论的发展 上一章我们介绍了传统心理物理学的三种基本方法。传统心理物理学方法用极限法、恒定刺激法和调整法来测定绝对阈限和差别阈限,并以阈限的倒数来表示感受性的大小,阈限值越小,感受性越高。 用传统心理物理学方法测定阈限时,常有一些非感受的因素对阈限的估计产生影响。因此,传统心理物理法测得的数据,往往是感受性和被试反应的主观因素相混合的。例如痛阈,因各人的主观因素不同,痛阈因人而异。所以,传统心理物理法的科学性和可靠性就受到一定的影响。 为了有效地测定感受性,传统心理物理法中也想设法通过各种手段来消除如动机、态度等因素的影响。正是由于采用种种手段,使传统心理物理法在感受性测量中能得到较科学和较可靠的结果。 但上述这种种手段也不能从根本上排除被试的主观态度的一类因素的影响。所以我们常发现,用传统方法获得的结果,有时甚至是相互对立的。 例如,精神分裂症患者和正常人关于大小常性的对照研究: 伯雷斯等人认为精神分裂症患者比正常人的大小常性要高; 汉米尔顿等人则认为精神分裂症患者比正常人的大小常性要低; 皮什克姆-史密斯等人的看法认为他们彼此并没有差别。 这些情况,以前总认为是实验条件和方法的不同造成的,实际上,最根本的问题是无法把感受性的测量和被试的动机、态度等主观因素所造成的反应偏向区分开。 而信号检测论,在测定感受性上,能把被试的主观态度区分出来。所以,我们把费希纳倡导的心理物理学三种基本方法称之为传统心理物理法,而把信号检测论这一心理物理法的新发展称为现代心理物理学。 但是必须注意,不能因此否定传统心理物理法在测定感觉阈限方面的作用,一般情况下测定感受性,传统心理物理法是可用的。 而信号检测论的实验更宜用于人的主观因素对实验结果影响较大的实验条件中,它解决了传统心理物理法所不能解决的问题。 (一)传统的阈限概念 传统的阈限概念起源于费希纳。波林在《实验心理学史》一书中指出,心理物理学的古典问题有五个: (1)绝对阈限:观察者对个别刺激的感受; (2)差别阈限:观察者对刺激增量的感受性; (3)等量:被判断为相等的刺激,一般指主观判断的强度方面; (4)感觉距离:被判断为相等的两对刺激间的差别; (5)感觉比例:彼此判断为有特定比率的那些刺激。 史蒂文斯的补充 (1)刺激次序:观察者将某些组的刺激排成等级或次序的测定; (2)刺激等级评定:确定观察者评定刺激的真正物理值的准确性。 由此可见,一百多年前,费希纳在创建心理物理学时,就把注意力集中在感觉阈限的测量上。 经过长期来的研究,形成了许多阈限理论,包括柏拉克韦尔的高阈限理论,路司的低阈限理论,格林的高-低两种阈限理论,以及史蒂文斯的神经量子理论和斯韦茨等人的信号检测理论。 从测量上考虑传统阈限的概念,最后形成了传统觉察理论基础。 这种觉察论假设有三个连续量:刺激、内部反应和判断。从图5-1中可见,刺激S2被定义为绝对阈限(T),因为它是引出“有”反应的一半次数。 上图的三种连续量是相互联系的。假设实验与实验间刺激的物理变量是固定不变的,而内部反应则被认为是可变的,每个恒定的物理刺激所引起的反应可看作是常态分配。这样刺激的连续将引起一系列重叠的分布。在这些重叠的分布中,阈限T就是一个固定点(参见中间一条线)。通常,被试判断的连续是被假设准确地对应于它的反应连续,当刺激强度超过阈限T时,被试判断有刺激出现,低于阈限T时,则判断无信号出现。 根据阈限的传统定义,刺激S2是这个被试的绝对阈限。由于反应分布是常态的,所以阈值对应于S2所引起的反应平均值。常态分布的对称性,使得刺激S2 所引起的反应有一半次数是超过阈限。一半次数不超过阈限。S1有时可以超过;S3 则一般会超过;S4 超过的概率就更高了。 (二)对传统阈限概念的异议 起源于费希纳的传统阈限概念,在20世纪50年代前,没有受到多大挑战。可是,近四十年来,关于阈限概念的理解上已成为古典的和现代的心理物理学争论的焦点。 50年代以后,许多心理物理学家愈来愈感到,经典的阈限测量最大的问题在于没有能够把被试的辨别能力(感受性)和他们做出判断时的倾向性(反应标准)区别开来。 也就是说,经典的阈限测量没有考虑许多非感觉变量对被试的影响。在这些非感觉变量中,主要有下列二种最为主要: 1.刺激出现的概率 传统的心理物理学实验中,刺激出现的概率以P(S)表示,其值总是1.0,这样被试做出“有”或“无”的判断时,即使凭机遇也有50%的精确性,难以避免地存在着期望误差。 实验证明,当P(S)系统变化时,做出“有”判断的概率以P(yes)表示,也会发生变化,测出的阈限值亦发生变化。 察觉指端震动的实验 实验结果表明,改变P(S)对于传统的阈限测量具有强烈的影响。当P(S)等于 0.7时,阈限是1.3微米;P(S)为0.3时,阈限则是2.3微米。而且,当刺激不出现时,P(yes)也明显地高于零。而根据传统的阈限理论,在不呈现刺激时,训练有素的、忠实可靠的被试者只是偶然地报告“有”感觉,P(yes)不可能明显地高于零。 2.反应代价 反应代价影响反应的结果,即反应受到奖赏和惩罚的影响。传统的阈限理论是对此忽略不顾的。 事实上,如果正确地报告了“有”刺激(称为“击中”)得到的奖赏多,而且错报时受到的惩罚少,则被试倾向于降低反应标准,在这种情况下,所测量的阈限相对值便低。反之,如果击中时所得奖赏少,而错报时所受惩罚多,则被试者倾向于提高反应标准,不会轻易做出“有”反应,这时,所测量的阈限值便高。这一显而易见的事实,传统的阈限理论恰不能给予解释。 从上述二种非感觉变量的讨论中看到,现代心理物理学从对阈限概念的不同理解出发,把被试者的辨别力和他的反应倾向区分开处理,而传统心理物理学测得的感觉阈限是二者不可分割的混合物。这是现代心理物理学对阈限概念和感觉理论的新发展。 (三)现代心理物理学的研究课题 现代心理物理学不仅对心理研究方法带来新的突破,而且也对心理学理论带来了巨大影响。这些变化不仅明显地表现在对阈限概念的理解上,而且也反应在心理物理学所研究的课题上。对研究的课题,现代心理物理学从系统论出发,将一个事物看成是有层次阶段和多水平的结构,因此,它所面临要解决的问题也是有层次和不同水平的事件。 具体地说,现代心理物理学课题可分割为检测、认知、分辨、量表等四个基本问题,叙述如下: 1.检测问题 检测(或觉察)(detection)就是察觉一个事物是否存在的问题。这是一个低水平、低层次的感知觉问题,它所要解决的问题是,人检测到了信号,报告为“有”,没有检测到信号,报告为“无”的简单问题。 在使用方法时,如果研究者承认“阈限”的存在,就可用传统的极限法和常定刺激法来测定阈限;如果不承认“阈限”的存在,就可用信号检测论来分析检测信号的辨别力和反应倾向。 2.认知问题 认知(cognitive)就是辨认一个事物的问题。这里已包括较高水平的问题,如当一个雷达操作员在屏幕上观察到了有信号以后,就要进一步向自己提出这样的问题:“这是什么?”。这就包括了复杂的知觉过程。这里包括可以采用信息论的方法来认知对象。 应当指出,检测和认知阶段有时是不可分的,相互联结的,所以有时也称为检测-认知阶层。 3.辨别差异问题 辨别差异是叙述某些事物与标准的区别问题。这是一个更高的梯级。例如雷达操作员要正确无误地分辨出这一刺激不同于别的刺激。心理物理学中的韦伯定律(或韦氏定律)(Weber’s law),分辨中的信号检测论,以及用反应时来测定分辨等,都属于辨别差异问题。 4.量表问题 量表(scale)这方面的研究方法和内容,已构成了一个专门的学科——心理测量学(psychometrics)。测量心理活动并转换成某种尺度(yardstick)的问题。 五、信号检测论的原理 (一)信号检测论的由来 (二)信号检测论的统计学原理 (三)信号检测论的二个独立指标 (四)接受者操作特征曲线 (一)信号检测论的由来 1、电子侦察系统中的信号检测问题 电子侦察系统中的关键问题是信息的传输和处理。首先将待传输的数据、资料等各类信息变换为电信号,再借助发射天线辐射到空间,经过电磁波传播,抵达接收天线,接受系统。将接收到的信号加以处理后还原,为所需要的信息,送入接收系统终端或使用者,从而完成信息传输任务。[E] 但是在传输过程中不可避免地会遇到: ①外界干扰和内部干扰; ②电磁波传播过程中无线电信号畸变; ③设备技术的不完善等因素的影响。 信号中混入了很多噪音,使信息传输的可靠性降低,这是信息传输过程中的不利因素。如何同这种不利的外界和内部的随机因素作斗争,使对噪音背景上的信号分辨率达到最好,提高信息传输的可靠性,这就是信号检测论所要解决的问题。 举例:雷达侦察系统 假定所要侦察的信号是在亮度均匀的背景上出现的一个短暂的闪光。这里对信号侦察起干扰作用的背景叫做噪音(N),短暂的闪光称作信号(S)·,因它是在均匀亮度的背景上出现的,所以又称信号加噪音,一般常写作SN。信号和噪音都是随机出现的。 电子侦察系统包括一个光电传感器和一个侦察反应器,前者是接收信号的,后者是对信号作出反应的。 如果光电传感器的输出达到某一临界水平,侦察反应器就以“有闪光”反应,如果达不到这个临界水平,侦察反应器就以“没有闪光”反应。这个临界水平可以根据需要进行调节。 如果要求尽可能不漏掉信号,就得把反应的临界水平调得很低,但这要付出一定的代价,那就是有时信号并没有出现,只要传感器的输出达到这个反应水平,侦察反应就出现“有信号”反应。此种情况用信号检测论的语言来说,叫“虚报”。 如果把反应水平调得过低,漏掉的信号可能会很少,但虚报的可能性却会相当大。反之,如果要求尽量减少虚报,就得把侦察反应器的反应水平调得很高。这样,在没有信号时虽然本会以“有信号”反应,但在有信号时传感器的输出由于达不到一定的反应水平,侦察器也不会以“有信号”反应。这样虚报的概率减少了,但报准(又称击中)的概率即不会很高。 从上述情况可以看出:虚报率与报准率都随着反应水平的变化而变化。 乍看起来,似乎在这些情况下,电子侦察系统对信号的辨别力发生了改变,但实际上不是这样,因为在这些情况下,传感器在接受和提供信息的性能上并没有发生变化,没有因反应水平的变化而有所不同,所不同的是侦察反应器对传感器提供的信息进行处理的方式发生了变化。 这里必须分清两个问题: 一个是电子侦察系统接收部分的辨别力问题 另一个是判定反应部分对所收到信息如何处理的问题。 信号检测论要解决的就是如何区分这两方面的问题。 2.人类感知过程的信号检测问题 人类的感知系统好比是一个信号觉察器,各感官都可看作是一个信息处理系统。我们把各种刺激看作是信号,把刺激的随机物理变化和感官信息处理中的随机变化看作是噪音。 这普遍存在于各个实验之中,各感官对信号的分辨问题与电子侦察系统对信号的分辨非常相似。 传统的心理物理学方法所测定的阈限,实际上包含着两方面的内容:一是对刺激的感受性或者叫做辨别刺激的能力,一是被试判定刺激是否出现的标准。 尽管在使用这些传统的心理物理学方法时,曾考虑到被试的态度、偏好、倾向和所采用的标准对测量阈限所产生的影响,并且采取了一些措施来消除这些影响。 例如在极限法中,采用渐增系列、渐减系列呈现刺激,用以平衡习惯误差和期望误差。 又如用AB法平衡练习误差和疲劳误差;用指导语规定被试的反应标准,并使之保持前后一致;有时对被试事先加以训练,使其在实验中的反应保持稳定等等。 但这一系列的措施,只能是使影响阈限的估计因素保持恒定,并不能测出被试的反应标准,也不能把反应标准和辨别力分开。 例如,恒定刺激法的三类反应。由于反应的偏好和自信程度不同,所测得的阈限往往差别很大。 因此,把感受性和判断标准加以区分,是心理物理实验中早待解决的问题。 (二)信号检测论的统计学原理 心理学上的信号检测实验一般是在信号和背景不易分清的条件下进行的。 对信号检测起干扰作用的背景叫噪音,这“噪音”不仅是指纯音信号出现时其他的噪音而言的;在视觉实验中,伴随着亮点信号出现时的照度均匀的背景也叫做“噪音”。 总之,对信号起着干扰作用的因素都可当作“噪音”。一般的心理物理的辨别实验,其中包含着刺激A和刺激B。在这种情况下,可将其中一个刺激作为噪音,另一个作为信号。 主试呈现的刺激,有时只呈现“噪音”刺激(以N表示);有时在信号刺激加噪音刺激同时呈现(以SN表示),让被试对信号刺激做出反应。 在呈现刺激前,主试要先告诉被试者N和SN各自出现的概率。这个概率称为先定概率(或先验概率)。同时对被试者说明判定结果的奖惩办法。因为先定概率和奖惩办法都将影响被试者的判定标准,每次实验呈现的是N还是SN是随机安排的。主试在呈现刺激之前(约2秒前)要先给被试者一个预备信号。 被试者对有无信号出现的判定 在信号检测实验中,被试者对有无信号出现的判定,可以有四种结果: 1.击中 当信号出现时(SN),被试报告为“有”,这称为击中,以Y/SN表示。我们把这个判定的概率称为击中的条件概率,以P(H)或P(Y/SN)表示。 2.虚惊 当只有噪音出现时(N),被试报告“有”,这称为虚惊(或误报),以Y/N表示。我们把这个判定的概率称为虚惊条件概率,以P(FA)或P(Y/N)表示。 3.漏报 当有信号出现时,被试报告为“无”,这称为漏报(或失察)(miss),以n/SN表示。把这种判定概率称为漏报条件概率,以P(M)或P(n/SN)表示。 4.正确拒斥 当无信号而只有噪音出现时,被试报告为“无”,这称为正确拒斥(correct rejection)或正确(correct),以n/N表示。我们把这个判定的条件概率称为正确拒斥的条件概率,以P(CR)或P(n/N)来表示。 这样,噪音背景下的信号检测实验,在每种刺激状态下都存在二种反应可能,其组合就构成一个两择一判决矩阵,其中H和CR是正确反应,M和FA是错误反应。如果用概率表示,则有: P(H)+P(M)=1 P(FA)+P(CR)=1 从式中可见,其他两个条件概率是这两个条件概率的补数,即知道其中一个数,就可求出互补的另一个数: P(H)=1-P(M) P(FA)=1-P(CR) 无噪音条件下的信号检测 从统计学观点来看,信号检测即是要检验两个统计假设H0(无信号)和H1(有信号)的真伪。设想检测者测量单一变量X,并以此为根据选择H0或H1。在无噪音条件下,当X=A0时,H0为真;当X=A1时,H1为真。 噪音背景下的信号检测 在噪音背景下,无信号时X并不总是等于A0,有信号时X也并不总是等于A1,而是分别形成两个概率分布P0(X)和P1(X)。这时,检测者需要确定一个反应标准Xc,将X分成二个值域,当X≤Xc时,判定H0为真;当X≥Xc时,判定H1为真。 在噪音背景下,无论将Xc确定在哪一位置,都存在有错误的可能,即虚惊错误FA和漏检错误M。如上图所示,曲线P0(X)在Xc右面部分所包含面积为虚惊率QFA,曲线P1(X)在Xc左面部分所包面积为漏检率QM。 因此,在信号分布和噪音分布不变的情况下,检测者选择的反应标准Xc将影响P(H)、P(M)、P(FA)和P(CR)。 反应标准的选择,称为检测者的反应偏向,它是信号检测论的两个独立指标之一。 [E] (三)信号检测论的二个独立指标 信号检测论者认为阈限不是一个纯净的感知能力的指标,它受利害得失、动机、态度、意志等因素的影响。而且,一般纠偏和校正猜测机遇的公式都不能对被试者的真实感知能力作正确的估计。因为被试者在报告他对某个刺激或信号的感受时,总是受到动机等因素的影响,考虑其得失利害,采用某种策略,做出某一抉择,使被试者自己的报告符合他最大的利益。 根据信号检测论把刺激的判断看成对信号的侦察和做出抉择的过程。这样,在同一过程中就出现了两个独立指标: 一个是感觉辨别力指标(d‘),表示感知能力,又称为感觉敏感性; 另一个是反应偏向,可用似然比值(β),有时也用报告标准(C)来表示,它包括利益得失、动机、态度等因素。 1.反应偏向 反应偏向可由二种方法计算: (1)似然比值——β 信号检测论中用以表示反应偏向的指标之一是似然比值β,意指信号加噪音引起的特定感觉的条件概率与噪音引起的条件概率的比值,其数学定义为给定Xc水平上信号分布的纵轴与噪音分布的纵轴之比。 当β值偏高时,Xc右移,P(H)和P(FA)均下降,表示检测者的反应标准较严;当β值偏低时,Xc左移,P(H)和P(FA)均上升,表示检测者的反应标准较宽。 信号检测论可以给出在给定信号强度和敏感性水平下能得到的最大收益的β值(βOPT)。就物理环境而言,βOPT的主要影响因素为信号概率和两择一判决矩阵中四种可能结果的奖惩(支付)情况亦即支付矩阵。 支付矩阵 支付矩阵是指在一定的信号和噪音出现的先验概率条件下,对被试判断结果的奖惩办法。可表示为: 式中P(N)和P(S)分别是噪音概率和信号概率,V代表由正确反应得到的价值,C代表错误反应得到的代价(负值)。当V(CR)+C(FA)=V(H)+C(M)时,最大收益将从最小错误而得到。此时βOPT随信号概率P(S)的变化而变化(P(S)+P(N)=1),当P(S)上升时,放宽反应标准,即降低β是有利的反应策略;当P(S)降低时,严格的反应标准使提高β更有利。但当从正确反应中得到的收益与错误反应付出的代价不等时,βOPT将发生相应的变化。 β值的计算 计算过程中必不可少地要使用PZO转换表,表中P代表概率,Z代表标准分数,O代表概率密度,PZO转换表就是这三个数值之间的对应互换关系。 (2)报告标准——C 信号检测论中用以表示反应偏向的另一个指标是报告标准,又称判断标准(或判定标准)。在数学上,反应标准的另一种表示方法是感受经验强度,用符号C表示。C是横轴上的判定标准位置。在数学上,C的单位要转换成刺激强度单位,它的计算公式是: 2.敏感性指标 信号检测论的最主要贡献是在反应偏向与反应敏感性之间能作出区分。击中概率P(N)可以因为检测者持严格的反应标准(高β)而减低;另一方面,即使观测者持宽松的反应标准(低β),P(N)也可能因为敏感性的降低而降低。 敏感性可以表现为内部噪音分布fN(X)与信号加噪音分布fSN(X)之间的分离程度。两者的分离程度越大,敏感性越高;分离程度越小,敏感性越低。下图给出了反应偏向(β)相同的情况下,两种敏感性情况。 内部噪音分布fN(X)与信号分布fSN(X)的分离程度既受信号的物理性质影响,也受被试者(测验者)特性的影响。因此,fN(X)与fSN(X)之间的距离就可作为敏感性的指标,称为辨别力d’: (四)接受者操作特性曲线 接受者操作特性曲线,简称 ROC曲线,在心理学上又称为感受性曲线,这就是说,曲线上各点反映着相同的感受性,它们都是对同一信号刺激的反应,不过是在几种不同的判定标准下所得的结果就是了。 接受者操作特性曲线以虚惊概率为横轴,击中概率为纵轴所组成的坐标图和被试者在特定刺激条件下由于采用不同的判断标准得出的不同结果画出的曲线。