第02章 实验研究的基本问题
一、目的要求:
掌握实验控制(实验设计)的基本方法、掌握心理学实验报告的阅读和撰写方法。
二、讲授内容:
(一)心理学实验中的变量及其操纵
(二)实验研究的效度
(三)实验设计
(四)实验研究的信度
(五)心理学实验报告的阅读和撰写
一、实验研究中的变量及其控制
什么是变量
变量(variable)是指在数量上或质量上可变的事物的属性。
变量包括作业变量(刺激变量)、环境变量、机体变量
在一个具体的实验中,变量分为自变量、因变量和额外变量。?
(一)变量的类型
1、自变量
(1)什么是自变量
在实验中实验者所操纵的、对被试者的反应产生影响的变量称为自变量;
(2)自变量的类型
①作业变量(刺激变量、任务变量)
②环境自变量
③被试者变量
2、因变量
因为自变量的变化而产生的现象变化(行为表现),称为因变量。
3、额外变量
凡是对因变量产生影响的实验条件都称为相关变量;
对因变量不产生影响的实验条件称为无关变量(或无关变项)。
在相关变量中,实验者用以研究的变量称为自变量,实验者不用于研究的那些相关变量称为额外相关变量,或简称为额外变量。
由于在实验中额外变量是必须加以控制的,所以额外变量也被称为控制变量。
评价一项实验设计的好坏的一个重要依据就是看研究者能否成功地控制那些额外变量。
心理学实验中典型的额外变量
实验者效应
要求特征(霍桑效应、安慰剂效应)
(二)变量的操纵
1.自变量的控制
在实验中对自变量的操纵、变化称为自变量的控制。
对自变量的控制,首先要对自变量进行严格的规定,对心理学中一些含混不清的变量必须使之操作定义化,只有这样才能进行实验。
操作定义:指用可感知、度量的事物、时间、现象和方法对变量或指标作出具体的界定。
例如,把“刚刚感受到”定义为“50%次感受到”,就可测定感觉阈限了。
又如,疲倦(fatigue)没有一个共同的起点和尺度,怎么测量呢?如果定义为“工作效率的下降”,那么就可以进行测量和比较了。
其次,对于在刺激维度上连续变化的自变量,要做好三项工作:
(1)要确定好自变量的范围
(2)要选一定数量的检查点
(3)要确定好各检查点之间的间距。
2.因变量的控制
把实验中的被试者的反应控制在主试者所设想的方向上,这就是反应的控制问题。
以人作被试者,往往用指示语来控制被试者的反应。
指示语乃是心理实验中主试者给被试者交代任务时说的话。
使用指导语时,应注意在允许的范围内做到引起动机,激发兴趣。被试者来到实验室时,不一定对参加实验感兴趣。因此主试者必须利用言词来引起他们的兴趣。在可能的范围内,告诉他们实验目的与应用价值,使他们认识到参与和合作的意义。
反应指标的选择:
在心理学实验中,一般常用的指标有:
绝对阈限
差别阈限
反应时
反应持续时间
反应程度
完成量
错误率
完成一定的作业所需要的时间
达到一定基准所需要的次数
口头报告
……
选择指标的条件主要有:
有效性,即指标充分代表当时的现象或过程的程度,也称为效度。
客观性
数量化
3.额外变量的控制
排除法
恒定法
匹配法
随机化法
抵消平衡法
统计控制法
二、实验效度
实验效度是指实验方法能达到实验目的的程度。
实验目的是验证假设,验证自变量和因变量之间的关系,使实验结果的推论可用以解释和预测其他同类现象。
由于不同的实验者在设计上和在对额外变量的控制程度上极不相同,实验的效度也会有很大的不同。
此外,每种实验都有几个不同的组成部分,其中每一部分也会影响整个实验的效度。
了解影响实验效度的诸因素,将有助于我们评价实验设计的质量,提高实验设计的科学性。
实验效度主要包括内部效度和外部效度。
(一)影响实验内部效度的因素
实验的内部效度是指实验中的自变量与因变量之间的因果关系的明确程度。
一项实验的内部效度高,就意味着因变量的变化确系由特定的自变量引起的。
由于除了自变量以外,任何额外变量都可能对因变量产生影响,导致实验结果的混淆。这样我们就难以判定实验中自变量与因变量之间的关系的确定性。
因此,要使实验具有较高的内部效度,就必须控制各种额外变量。
在设计实验时,如果能考虑到以下六个方面的因素,将有助于提高实验的内部效度。
1.生长和成熟
除了实验中的自变量可能使个体行为发生变化外,个体本身的生长和成熟也是使其行为变化的重要因素。特别是在以幼小的儿童为被试者而又采用单组前测后测实验的情况下,生长和成熟因素的影响就更大。
单组前测后测实验通常是实验处理之前先对被试者的某种行为作一次测量,实验处理后再以同样方法测量一次,两次测量之差即表示实验变量(即自变量)产生的效果。
很明显,这种设计忽略了前后两次测量之间被试者的生长和成熟因素,其实验效果易受生长和成熟因素的混淆,从而降低了内部效度。
解决的主要办法是增设同样条件的控制组进行比较。
2、前测的影响
在一般正常情况下,前后两次测量的结果会有一定的差异,后测的分数将比前测的高。这中间包括练习因素、临场经验、以及对实验目的的敏感程度,从而提高了后测的成绩。特别是前后两次测量时间较近,这一因素的影响就更显著。
3、被试者的选择偏性
在对被试者进行分组时,如果没有用随机取样和随机分配的方法,在实验处理之前,他们在各方面并不相等或有偏性,从而造成实验结果的混淆,降低了内部效度。
4、被试者的缺失
如果是一项长期的实验,要保持原实验被试者的人数不变是相当困难的。即使开始参加实验的被试者样本是经过随机取样和随机分配的,但由于被试者的中途缺失,常常使缺失后的被试者样本难以代表原来的样本。这就降低了内部效度。
5、实验程序的不一致
在实验过程中,实验仪器、控制方式的不一致,测量程度的变化,实验处理的扩散和交流等都可能混淆实验变量(即自变量)的效果。实验者知道实验目的所产生的“实验者效应”以及被试者知道实验目的或其自己正被研究所产生的“霍桑效应”和“安慰剂效应”等都将混淆实验变量(即自变量)的效果,从而降低了内部效度。
6、统计回归
统计回归现象是,第一次测量平均值偏高者,第二次测量平均值有趋低的倾向(向常态分布的平均数回归);第一次测量平均值偏低者,第二次测量平均值有趋高的倾向(也向常态分布的平均数回归)。
(二)影响实验外部效度的因素
实验的外部效度是指实验结果能够普遍推论到样本的总体和其他同类现象中去的程度,即实验结果的普遍代表性和适用性。
以人的行为为对象所获得的实验结果,其推论法往往有相当的局限性。
实验的外部效度主要受下列三方面的影响:
1、实验环境的人为性
实验是在控制条件下进行的,实验环境的人为性可能使某些实验结果难以用来解释日常生活中的行为现象。
实验室中的仪器设备会影响被试者的典型行为。
被试者参与实验的动机也会影响其行为表现。
而在实验室之外的日常生活中,就不会有这些因素的影响。因此,实验结果还不能完全等同于实验室之外的日常行为现象。
2、被试者样本缺乏代表性
从理论上讲,从事于实验的被试者必须具有代表性、必须从将来预期推论、解释同类行为现象的总体中进行随机取样。但实际上这是很难做到的。
因为,如果总体很大,即使能够随机取样,但心理学实验的被试者通常是自愿的,所以也很难把被随机选上的人全都请来做实验。
如果总体是无限的(例如,“七岁儿童”就是一个无限的总体,其包括过去的、现在的、将来的所有七岁儿童),随机取样实际上是行不通的。这样的实验结果自然会降低其外部效度。
3、测量工具的局限性
实验者对实验变量(即自变量)和反应变量的操作性定义往往以所使用的测量工具的测量结果来加以考虑的。
例如,把成就动机作为一个因变量,实验者常以某种成就动机量表所测得的分数来界定并评定其强度。但成就动机的测量工具有各种不同的形式,所测量出的分数并不代表同一种成就动机及其强度。如果在实验时采用的是某一种成就动机的量表,那么所得出的实验结果便不能推论到采用其他成就动机的量表的情况中去。
实验的内部效度和外部效度是相互联系、相互影响的。提高实验内部效度的措施可能会降低其外部效度,而提高实验外部效度的措施又可能会降低其内部效度。
这两种效度的相对重要性,主要取决于实验的目的和实验的要求。一般而言,在实验中控制额外变量的程度越大,则对因果关系的测量就越有效。因此,可以在保证实验内部效度的前题下,采取适当措施以提高外部效度。
三、 实验设计
(一)实验设计的概念
实验设计乃是进行科学实验前做的具体计划。它主要是控制实验条件和安排实验程序的计划。它的目的在于找出实验条件和实验结果之间的关系,做出正确的结论,来检验解决问题的假设。
(二)实验设计的内容
①刺激变量(或刺激变项)的确定及其呈现的方式;
②反应变量(或反应变项)的指标及其测量方法;
③对一切有关变量(或变项)的控制措施;
④确定被试总体及被试样本人数和选择被试的方法;
⑤拟定主试在实验开始前对被试者要说的指示语;
⑥规定实验次数;
⑦安排实验程序;
⑧规定使用仪器的型号;
⑨规定处理实验数据的方法。
实验设计的基本类型Ⅰ
从对实验控制条件的严密程度的不同:
①真实验设计
②准实验设计
③非实验设计
根据实验中要操纵变量的多少:
①单因素实验设计
②多因素实验设计
根据在各种自变量及各种处理水平中是否用相同被试:
①被试内设计
②被试间设计
③混合设计
(一)被试内设计
也叫单组实验设计(within-subjects design),是每个被试须接受自变量的所有情况的处理。
基本原理:每个被试参与所有的实验处理,然后比较系统被试在不同处理下的行为变化。
在实验研究中,如果实验者主要想研究每一个被试对实验处理所引起的行为上的变化,可考虑采用被试内设计。
被试内设计可分为三种子类型:1、实验前后设计;2、定时系列设计;3、抵消实验条件的设计。
1、实验前后设计
指在实验条件处理前对被试进行观测的结果与实验条件处理所做的同样观测结果加以对比的设计。即,这种设计类型是实验(处理)前后的比较设计。
实验前与实验后设计模式
实验前后设计举例
目的:第一次参加射击运动的人在接受打靶训练前后打靶成绩的变化。
方法:选择10名从来没有参加过射击运动的被试,在他们进行打靶练习前,先进行一次打靶测验,记录下他们的打靶成绩(前测成绩)。然后对他们进行为期1周的打靶训练,每天2小时。训练结束后,再次对他们的进行打靶测验,记录下他们的成绩(后测成绩)。将前后两次成绩进行比较,就可以看出1周的训练是否有效果。
实验前后设计评价
优点:(1)能较明显地检测初实验处理的效果如何;(2)对被试的需要量较少,一组被试当两组被试用,无须设控制组,不但提高效率,被试变量也得到较好控制。
缺点:(1)前后两次观测之间存在时间间隔,会带来外来影响;(2)易产生顺序误差。
2、定时系列设计
指实验处理前对一组被试作一系列的定时重复观测,然后实施实验处理。在对被试作一系列的定时重复观测,分析自变量(实验处理)对因变量的关系。
定时系列设计模式
说明:Y1a、Y1b、Y1c分别表示实验处理前之观测值
Y2a、Y2b、Y2c分别表示实验处理后之观测值
X表示实验条件处理
定时系列设计举例
代币法对儿童问题行为矫正的作用
定时系列设计评价
优点:除具有前后设计的优点,还具有(1)降低由于一次观测而得到被试不正常行为的几率;(2)提供测量过程中的信息。
缺点:(1)由于更多次的观测,势必延长实验时间,从而会有更多的外来影响;(2)也正是更多次的观测,更易引起顺序误差,更易导致练习、疲劳、紧张或厌烦等效应。
3、抵消实验条件的设计
指抵消实验过程中无关变量的一种设计。
前面讲到,有些无关变量在某些实验情况下既不能被消除,又不能保持恒定。例如,单组实验往往由于前一处理影响后一处理的效果,产生顺序误差。为了抵消顺序误差,最简单的方法就是用ABBA的排列顺序来安排实验顺序。其模式如下表所示。
抵消实验条件的设计示例:人们解决两个不同问题的思维特点分析
抵消实验条件的设计评价:
优点:
(1)能较好地控制被试变量;
(2)能较好地控制顺序误差;
(3)时间上比较经济。
缺点:
(1)反应变量在时间维度(轴)上的关系是线性时才能使用。
(2)对有些实验不适用。如用两种学习方法学习同一实验材料。
(二)被试间设计
被试间设计是要求每个被试(组)只接受一个自变量的处理,对另一被试者(组)进行另一种处理,故又称独立组设计。
包括随机组设计和配对组设计。
被试间设计的统计检验——独立样本的差异显著性检验。
1、随机组设计
将被试随机分配在不同的组内接受不同的自变量处理。
随机组设计的基本假设是将被试随机分配到不同的组,若对各组用同一样的课题,在系统的条件下进行测量,其结果就成为系统组,则他们的成绩在统计上应是相等的。
随机组设计的优缺点
优点是:(1)用随机分配被试者的方法可控制两组被试者变量的差异,分组方法简单可行。(2)由于对每一被试者只作一次观测,可消除某些实验误差,如消除学习误差的影响。
缺点是:(1)分成等组的方法仍欠精密。(2)若两组在不同时期观测,就有可能插入实验以外的偶发事件,影响因变量的观测结果。
2、配对组设计
也叫对等组设计、匹配组设计,是随机组设计的一种扩展。目的是使各组的特性更加相同。这种设计可以控制组内变异和组间变异。
匹配被试就是对全部被试进行预备测验,测验的性质与正式实验的性质是类似的,或者说是相关的,然后按测验成绩均匀地形成组。
配对组设计的步骤
第一步:让所以被试做“共同作业”,即接受预备测验,获得作业分数;
相同任务:如打靶;根据打靶成绩进行分组;
类似任务:如问题解决→不同种类问题解决;
相关任务:如智力测验→问题解决。
第二步,根据作业分数形成配对组。
配对设计的优缺点
优点:在实验处理之前,就把组间变异缩到最小,并使各组内变异比单独的随机分配更接近相等。因此,这种设计能对被试个别差异给予更多的控制,小型实验用配对设计,其效果比用随机分组的效果更为显著。
缺点:实验者因分配被试而大大增加工作量。
(三)混合设计
混合设计是指在一个研究中有些自变量按组内设计安排,有些自变量按组间设计安排。一般说来,如果一种自变量很可能会影响另一种自变量,那么对这些自变量按组间设计安排,其余的自变量按组内设计安排。
混合设计举例一
Johnson等(1983)用混合设计的方法比较抑郁者和非抑郁者的记忆成绩。
他们假设,抑郁者比非抑郁者对于未完成的记忆任务的记忆效果更好。
实验中,要求抑郁组和非抑郁组完成20项记忆任务,其中,10项记忆任务在完成之前被打断。在全部任务完成后,要求被试回忆记忆任务的名称或尽可能多地描述记忆任务。
比较
被试变量是组间设计(抑郁、非抑郁)
任务类型是组内设计(完成、未完成)。
混合设计举例二
让被试以不同的背诵方式对一系列意义上没有联系的3个英语单词为一组的材科进行加工,背诵的次数也不相同。
背诵方式有4种,产生了4种实验条件: (1)数字条件。(2)机械背诵。 (3)造句背诵。(4)想象背诵。背诵次数分别为1, 2,4,8,10次,每次背诵时间为2秒。
混合设计
背诵方式为组间设计:所有被试分成4组,每组被试只用一种方法背诵。
背诵次数为组内设计:但在每种背诵方式下,背诵次数都有1,2,4,8,10五种.每个被试都要按随机安排的顺序轮流进行这五种不同次数的背诵 。
实验设计的基本类型Ⅱ
(一)真实验设计
真实验设计对实验条件的控制程度要求 较高,在使用这类实验设计时,实验者可以有效地操纵实验变量,能有效地控制内在无效来源和外在无关因素的影响,能在随机化 原则基础上选择和分配被试,从而使实验结果更能客观地反映实验处理的作用。
真实验设计类型
真实验设计之一:完全随机化设计
真实验设计之二:多因素实验设计
真实验设计之三:随机化区组设计
真实验设计之一:完全随机化设计
完全随机化设计也称简单随机化设计,是指用随机化方法将 被试随机分为几组,然后依实验的目的对各组被试实施不同的处理。
1.随机实验组控制组前测后测设计
随机实验组控制组前测后测设计是指研究者在实验前采用随 机分配的方法将被试分为两组,并随机选择一组为实验组;另一组 为控制组。实验组接受实验处理,而控制组则不给予实验处理。
(1)设计的模式
(2)设计的评价
(3)设计的显著性检验
(4)设计的实例分析
(1)设计的模式
R O1 X O2
R O3 O4
(2)设计的评价
随机实验组控制组前测后测设计基本控制了绝大多数影响内 部效度的因素。
这是因为该设计采用随机布置的方法将被试分为两组,从而可以控制选择、被试的中途退出以及选择与成熟的交互 作用等因素对实验结果的干扰。
另外,由于安排了实验组和控制组,在实验过程中,发生在前测到后测这段时间内的事件对实验组控制组的影响基本相同,因而可以控制历史、成熟、测验、仪器使用 等影响内部效度的因素对实验结果的影响。
该设计使用了前测验.它为检查随机分组是否存在偏差提供了充分的 依据.但它也带来了不利的一面,即被试由于前测验而获得的经 验,可能对后测验产生敏感性,出现测验的反作用效果,导致对实验设计外部效度的影响。
(3)设计的显著性检验
其一是对增值分数进行统计分析。方法是对每一名被试,用其后测成绩减去前测成绩(O2-O1,O4-O3), 分别求出两组增值分数的平均数。对两组增值分数进行显著性检 验的方法有:t-检验(参数统计);曼—惠持尼(Mann—Whitney)U-检 验或中位数检验(非参数检验)。
另外,还有协方差分析法,这种方 法被研究者认为是很好的方法。此方法是将前测分数作为协变量,对实施实验处理前的组间差异进行控制和调整,以便使两组的后 测成绩能够比较不受前测成绩的影响。
(4)设计的实例分析
沃坦阿贝、黑尔和洛马克斯关于“通过一系列教学程序和方法的训练,来培养学生根据报纸标题预测所报道内容的能力”的实验。
2.随机实验组控制组后测设计
(1)设计的模式
R X O2
R O4
(2)设计的评价
首先,由于采用实验组接受实验处理,控制 组不接受实验处理,从而控制了历史和成熟因素对内部效度的影 响;
另外,由于实验是在同等条件下进行的,因此它控制了选择和 被试的中途退出等影响内部效应的因素。同时.由于两组被试没有 进行前测验,从而控制了测验与实验处理交互作用对实验外部效 度的影响。
(3)设计的显著性检验
随机实验组控制组后测设计使用的统计分析方法比较简单。 大部分研究者使用f—检验对两组后测成绩进行比较研究;非参数检验也常使用曼-惠持尼U-检验或中位数检验法。
(4)设计的实例分析
卢仲街等(1981)的研究项目“初中一年级数学自学辅导教学协作实验研究” 。
3.随机多组后测设计
在心理学的研究中,有时要进行实验处理的方案不只是一个 或两个,即有时研究者要进行的实验处理x的个数有3个或3个 以上。
设计的模式
R xl Ol
R x2 O2
R x3 O3
真实验设计之二:多因素实验设计
多因素实验设计是指在实验中包括两个或两个以上因素(自变量),并且每个因素都有两个或两个以上的水平,各因素的各个水平互相结合,构成多种组合处理的一种实验设计,又称完全随机析因设计。
在完全随机析因设计中,研究者可以考察各个自变量交互作用对因变量的主要影响效应(交互作用),并同时考察各自变量对同一因变量的主要影效应(主效应),以及考察一个因素的各个水平在另一个因素的某个水平上的效应(简单效应);在心理学的实验研究中,这种设计具有很大的实用价值。
1.多因素实验的优点
多自变量实验具有三个明显的优点:
效率高
实验控制较好
实验结果更有价值
2.完全随机析因设计
在析因设计中,为简化表述,常常采用一些英文字母、符号和数字,作为各个因素和因素各个水平及其相互关系的标志。
通常用英文大写字母来表示因素,用与大写字母相对应的小写字母来代表因素的水平,而用乘号(×)表示因素之间的相互结合关系。
例如,在包括两个因素且其中一个因家有2个水平,而另一个因素有3个水平的析因设计中,以A和B代表两个因素,以a1、a2相b1、b2和b3分别代表因素A和因素B的水平。我们称其为双因素设计,又称A×B因素设计,也可称2×3因素设计。
完全随机双因素析因设计
完全随机双因素实验设计是指研究者用随机分配的方法将被试分为若干同质组(分组的个数等于实验处理的个数),同时用随机的方法分配每一组被试接受一种实验处理的实验设计。
由于双因家析因设计实验处理的个数是由两个因素的水平数交叉组合决定的,所以双因素析因设计的模式也与各因素的水平数有关。
双因素析因设计的主要效应与交互作用的效应
主效应是指由每个单独因家(自变量)所引起的因变量的变化。
交互作用的效应是指当一个因素(自变量)对因变量影响大小因其他因素的水平或安排的不同而有所不同时,所产生的交互作用影响因变量的结果。相反,如果某一因素(自变量)对因变量影响大小,不受其他因素的水平或安排的影响,我们就说这个因素与其他因素是没有交互作用的。
杨治良等(1981)的实验
目的:了解年龄对再认能力的影响
第一个自变量是年龄,选取初中生年龄组和大学生年龄组。第二个自变量是实验材料,这里我们选取具体实物图形组和词组两个组。因变量取再认能力d‘作指标。
这个实验的方法是采用再认法,把被试者识记过的材料和没有识记过的材料混在一起,要求被试者把两种材料区分开来。
真实验设计之三:随机化区组设计
随机化区组设计是将被试按某种标准分为不同的组(区组),每个区组的被试接受全部发实验处理。
随机化区组设计的目的在于使区组内的被试差异尽量缩小,而对区组之间的差异依据设计要求而定。每种处理出现在每个区组中,这时区组之间的差异并不影响在各处理平均数间的差异。
随机化区组设计的原则
随机化区组设计的原则是同一区组内的被试尽量“同质”。
每一区组内被试的人数分配有3钟情况:
一名被试作为一个区组。这时,每名被试(区组)均接受全部处理,在接受处理的顺序上要采用随机化的方法。
每个区组内被试的人数是实验处理数目的整倍数。
区组内的基本单元不是一名被试或几名被试,而是以一个团体为单元。
1.随机化区组单因素设计
随机化区组单因素设计与随机多组后测设计是基本相似的,不同的是随机化区组单因素设计要求将被试划分为不同的区组,并且每一区组随机接受所有不同的处理。然后观察实验处理后每个区组对不同处理的反应,并作为后测成绩。
2.随机化区组多因素设计
随机化区组两因素设计与随机化双因素设计基本相似,只是随机化区组两因素设计将被试划分为不同的区组,每个区组都随机接受两因素各个水平组合的全部处理,然后观测每个区组对不同处理的反应,并将反应值作为后测成绩。
(二)准实验设计
1.单组准实验设计
在心理学研究中,有时会因条件的限制和问题的性质而使研究无法采用控制组,从而选取准实验设计进行研究。
(1)时间序列设计
时间序列设计是指对一组被试或个体进行一系列周期性测量,并在测量的时间序列中引进实验处理(X),然后观测引进实验处理后的一系列测量结果,并与引入实验处理X前的一系列测量结果相比较,研究插入实验处理前后测量结果的变化趋势,从而推断实验处理是否产生效果。
时间序列设计模式
时间序列设计举例
学习心理咨询前后学生学习兴趣和学习习惯。
时间序列设计可能的实验结果
时间序列设计评价
时间序列设计可以较好地控制“成热”因素对内部效度的影响。
其次,该设计可以控制测验因素的干扰。
由于每名被试都要经过多次测验,并得到一系列测验结果.这就能够降低由于只作一次测验而出现的有偏向性样本成绩的概率。同时,该设计有可能控制统计回归的因素。
综上所述,由于时间序列设计可以多次测量被试在处理前后的数据,因此通过观察处理x前后的变化趋势,也就可以判断处理x前后在整个实验过程中的作用。
缺点
首先,由于该设计研究是在没有控制组的情况下进行的,因而它不能控制与实验处理同时发生的偶发事件的影响,不能排除那些与自变过同时出现的附加变量的影响。
其次,测验与处理x的交互作用作为影响实验外部效度的因素在该设计中不易受到充分控制。
再次,多次实施前测验往往会降低或增加被试对实验处理的敏感性,从而在被试身上产生作用而影响被试在实验处理后的成绩。
(2)相等时间样本设计
在心理研究中,与选择两等价样本组(实验组和控制组)相对应,当只有一组被试时,常使用两相等的时间样本,在其中的一个时间样本中不出现实验变量,而采用常规安排X0。
相等时间样本设计MOSHI
相等时间样本设计举例
教师批改作业对学生学习成绩的影响。
相等时间样本设计评价
相等时间样本设计在控制影响内部效度的因素方面是完全有效的。
它能较好控制“历史”作用的影响;
其他影响内部效度的因素也同时被较好地控制。
缺点
相等时间样本设计在控制影响外部效度的因素方面并不理想。
①测验的反作用效果会影响该设计的外部效度。
②实验安排的反作用效果会影响该设计的外部效度。
③选择偏差与实验变量的交互作用可能会影响该设计的外部效度。
④重复实验处理的干扰也会影响该设计的外部效度。
(3)交叉滞后组相关设计
交叉滞后组相关设计要求在时间1对两个变量(A、B)的关系作出测定和相关分析,再在时间2作相似测定和分析,当交叉滞后相关之间有显著差异时,就可以推测变量A和B之间具有因果关系。
交叉滞后组相关设计举例
三年级儿童对于暴力或凶杀电视片与他们的攻击性行为之间的关系
饮食和体重之间的关系
(4)回归间断点设计
这种准实验设计通过实验处理与事后测量回归线的间断点的特征,确定准实验处理的主效应。即如果实验处理前后的的回归线出现了间断,说明实验处理是有效果的。
回归间断点设计举例
奖励对职工工作成效的作用。
(3)交叉滞后组相关设计
交叉滞后组相关设计要求在时间1对两个变量(A、B)的关系作出测定和相关分析,再在时间2作相似测定和分析,当交叉滞后相关之间有显著差异时,就可以推测变量A和B之间具有因果关系。
交叉滞后组相关设计举例
三年级儿童对于暴力或凶杀电视片与他们的攻击性行为之间的关系
饮食和体重之间的关系
(4)回归间断点设计
这种准实验设计通过实验处理与事后测量回归线的间断点的特征,确定准实验处理的主效应。即如果实验处理前后的的回归线出现了间断,说明实验处理是有效果的。
回归间断点设计举例
奖励对职工工作成效的作用
2.多组准实验设计
在心理学研究中,为使实验结果尽量少受无关因索的干扰,使实验结果具有较高的可靠性,在条件允许的情况下应该采用多组实验设计,即包括有实验组和控制组存在的实验设计。
(1)不相等组实验组控制组前测后测设计
不相等实验组控制组前测后测设计的特点是研究者不能按随机化原则和等组法来选择对等组,有时也不能随机安排哪个为实验组、哪个为控制组。
设计模式
举例:思维训练
评价:
首先,由于增添了控制组,从而使该设计基本上控制了历史、成熟、测验等因素对实验的干扰。
其次,由于两组都有前测验,研究者可以了解实验处理实施前的初始状态,从而也就对选择因素有了初步的控制。
缺点:
该设计没有使用随机化方法来分配被试或实验处理,实验组与控制组是不对等的,因而选择与成熟、选择与实验处理的交互作用可能会降低该设计的效度。
又由于两组都使用前测验安排,因而其实验结果不能校直接推广到无前测的情境中去。
(2)不相等组实验组控制组前测后测时间序列设计
不相等实验组控制组前潦后测时间序列设计是在单组时间序列设计和不相等实验组控制组前测后测设计的基础上,组合而成的一种多组准实验设计。
设计模式
举例
评价
(3)平衡设计
平衡设计又叫轮换设计,或拉丁方设计。在该设计中,研究者为了达到对实验控制的目的,使各组被试都接受不同的实验处理.而对实验处理的顺序相实验时间的顺序采用了轮换的方法。
设计模式
举例
研究4类测验对学生问题解决的影响
评价
(三)非实验设计
1.单组后测设计
在单组后测设计中,只有一个实验组,而对实验组只给予一次实验处理,然后通过测量得到一个后测成绩。
单组后测设计模式
举例
数学课外辅导讲座对学生数学学习成绩的影响。
评价
2.单组前测后测设计
单组前酗后谢设计是对单组后测设计的一种改进,它增加了在实验处理前的测验,但还是仅有一组实验组。
单组前测后测设计模式
举例
威待墨(J Witter) “七年级低成就学生态度和成就的咨询和辅导效应”
评价
3.固定组比较设计
固定组比较设计又称静态组或整组比较设计,该设计采用实验组和控制组两组被试,但因这两组被试在实验处理前就已经形成,故它不能使用随机化的原则来选择被试。
设计模式
举例
评价
4.事后回溯设计
事后回溯设计是指所研究的对象是已发生过的事件。
在研究过程中,研究者不需要设计实验处理或操纵自变量,只需通过观察存在的条件或事实,将这种已自然发生的处理或自变量与某种结果或因变量联系起来加以分析,以便从中发现某种可能的简单关系。
设计模式
两类事后回溯设计
(1)相关研究设计
(2)准则组设计
(1)相关研究设计
相关研究设计是在一个被试组内收集两个集合的数据,其中一个数据集合是观察到的结果,另一个则是被追溯的数据集合,研究的目的是确定这两个数据集合之间的关系(正相关、负相关和无关)。
相关研究设计模式
相关研究设计举例
吸烟与肺癌的关系
关于相关关系
相关关系≠因果关系
(2)准则组设计
准则组设计与相关研究设计相类似,是对已经发生的事件进行研究的一种非实验设计。
它要求研究者通过对所研究现象的被试的比较,确定某些被试(准则组)具有一种状态的特征,而另一些被试(非准则组)不具有这种状态的特征,然后去追溯可能存在的原因。
准则组设计模式
准则组设计举例
影响教师教学效果的因素
评价
相关研究与准则组研究是事后回溯设计的两种主要形式,这两种研究是相辅相成的。
相关研究的主要用途是辨认两个变量或两种现象之间是否存在一定的关系及存在什么形式的关系;
而准则组研究的主要用途则是通过准则组与非准则组的对比,研究存在一定关系的两变量之间具有什么样的状态特征。
缺点
主要缺点是它缺乏对变量的控制。
事后回溯设计与变量的控制
就相关研究设计而言,如果两变量存在因果关系,那么该设计就缺乏对影响因变量效果的自变量的控制。
对准则组设计来说,它影响着对两个因变量效果差异的观测。
该设计还缺乏对随机化分配的控制。
但是,研究者可以采用适当的方法来对调查中的测量进行控制。
将调节变量引入事后回溯设计
举例
关于受过课堂开放教学方法训练的教师组和末受过这种训练的教师组的课堂环境的对比研究。
四、实验的信度
怎样验证实验结果的可信性?
关于类比问题解决的研究
邓克肿瘤问题:假如你是医生,面临着一个胃内有恶性肿瘤的病人。在肿瘤上不能动手术。但是,肿瘤不切除,病人就会死去。有一种辐射能摧毁肿瘤。如果辐射以足够高的强度立刻到达肿瘤,肿瘤会被摧毁。但不幸的是,当高强度的辐射经过机体的其他地方时,健康的组织同时也被摧毁。低辐射条件下,射线对健康肌体无害,但也不能对肿癌起作用。我们应该用什么类型的辐射去摧毁肿瘤同时又避免伤害健康的组织呢?(Gick和Holyoak,1980)。
吉克和霍利约克的研究(研究一)
最早研究中,45个被试只有2个(4%)提出了“会聚解决法”。
他们想研究:当在辐射问题前先给出一个类似的问题及其解决办法时,是否会有更多的人能解决这个问题。即是否被试能从第一个问题中抽象出指导原则,然后运用到第二个中去。
基于这种想法,吉克和霍利约克提出了其他的“类比故事”。这些类比故事蕴涵着高效解决辐射问题的基本原则。
类比故事——指挥官故事
一支坦克部队的指挥官要向敌军司令部(要塞)发起攻击。如果用许多坦克,他赢的机会很大;但他的部队必须经过又窄又不牢仅能通过少数坦克的桥,因此只能用少量的坦克发起袭击,但易被敌方击退。为了取得胜利,这支坦克部队指挥官制订了一个让坦克分别通过每座小桥包围敌司令部的计划。这样,所有坦克都能立刻过桥攻击和占领敌司令部。
实验设计
三种实验处理:
①解决问题前没有阅读指挥官故事;
②解决问题前阅读无关故事;
③解决问题前阅读指挥官故事。
前两种条件下
实验结果
在解决辐射问题前没有阅读故事或阅读无关故事的被试仅有大约10%是用最有效的方法解决问题的。在解决辐射问题之前阅读过类比故事,的被试约有75%在时间限度内解决了问题。
由于几个实验都得出了这样的结果,因此可以说这一基本现象是经过反复验证过了的。显然,人们的问题解决能从类比中受益。
提示是否有助于解释类比推理问题?(研究二)
吉克和霍利约克(1980) 思考了类比推理的过程。
他们让所有被试读类比故事,然后解决辐射问题。他们设置了两种条件:
①提示条件:提示利用故事作为提示考虑怎样解决问题。
②无提示条件:不提示被试刚读过的故事与他即将面临的问题解决任务之间存在的联系。
结果显示,提示确实是解决类比推理问题的一个重要因素。提示组92%的被试解决了问题;无提示组仅有20%。
可见,只给出类比是不够的,还必须引导被试在试图解决后一问题时要积极利用它。
类比问题解决实验的信度问题
结果是真的吗?如果重做这个实验,还会得到与之相同的结果吗?
考察实验信度的方法
1.推断统计
推断统计用于确定两种条件的结果差别是由自变量还是随机因素造成的。如果不同实验条件下所得出的结果之间差异很大,而且这种差异由偶然因素导致的概率低于5%时,研究者可以排除偶然因素导致该结果的可能性,而认为结果是由自变量造成的。
吉克和霍利约克的实验中有无提示条件的结果,他们运用推断统计得出,两组间解决问题百分比的差异不是由偶然因素,而是由实验中是否有提示条件造成的。因此,我们可根据这个统计检验得出差异具有统计信度。
统计推断的问题
“重复一次抵得上一千次t检验”。
尽管结论在统计上被认为是可信的,但由偶然因素(统计信度仍保留5%的错误概率)、一些末被注意到的混淆因素、或者实验者误差所造成错误的可能性仍然存在。
例如,大多数聪明的被试碰巧被分到一种条件中。
2.实验验证
三种实验验证方法:
①直接验证
直接验证是指在尽可能保持原实验方法的情况下在实际中重复它。
例如:如果我们想要尽可能准确地重复吉克和霍利约克(1980)关于提示是否有助于类比迁移的实验,就构成对他们实验的直接验证。
②系统验证
所谓系统验证,就是系统变化那些被认为与实验结果不相关的因素,考察是否会出现同样的实验结果。
也就是说,如果原始实验中发现的某种现象是真的,那么,尽管重做中一些因素发生了变化,但它仍然该出现。
前面提到的吉克和霍利约克的研究中,研究二就可以看作是对研究一的系统验证。
③概念验证
所谓概念验证,就是根据一个较为抽象的概念或者理论模型设计实验,验证实验结果。
吉克和霍利约克(1983)关于正迁移的条件的研究
他们想考察迁移量是否随着被试加工类比故事的方式的不同而发生变化。
实验材料:辐射问题和另一个别的问题;两个问题的类比故事;
实验设计:
①控制条件:只呈现类比故事而不带任何指导语;
②告诉被试概述故事而不要为了回忆测验而学习;
③是否以言语或文字的形式给出被试这一故事所表达的道理和它的策略本质;
④把图解和故事一起呈现给被试;
实验结果:正迁移量没有发生变化。
进一步的研究
吉克相霍利约克(1983)发现,当被试学习两个类比故事并亲自描述其相似性(在问题前给出)时,产生的正迁移要比只是学习一个大得多。他们认为,被试学习两个类比故事,然后思考其相似性能产生好的内在观念(或用他们话说,因式),这一观念能自动地用于解决新问题。
尽管吉克和留利约克(1983)的实验并非直接或系统地验证了他们早期得出被试难于自发应用类比解决问题的实验研究,但他们会聚出了一个相同的结论,即难于从类比来改善推理。
因此,这些后来做出的实验可被看作概念验证,尽管实验技术不是原实验中的重复,但在某种程度上他们验证了那种没有明确指导的类推困难现象的本质。