第18章 人的因素实验
一、目的要求:
了解人的因素的实验研究
二、讲授内容:
(一)引言
(二)变量介绍
(三)实验主题与研究范例
引言:人的因素和人的行为
定义
人的因素被定义为“试图在技术系统与人之间寻找最优化结合的学科”(Kantow比和Sorkin,1983,p.4)。技术包括一些很小的和很普通的,比如开罐刀具,也包括一些大的、深奥的,比如空间站。技术的公分母是人;所有大的和小的系统必须由人来操作。假若对人类的操作特征和现状有了充分的了解,那么我们就能原则上设计出有着更好的人—机界面的所冉技术系统。
在人的因素中,人所具有的核心地位说明了为什么实验心理学对人的因素的研究有如此大的影响。人的因素学会(HumanFactorSciety)中有一半以上的成员受过心理学的专门训练。发表在《人的因素》杂志上的文章有相当一部分被认为是实验心理学的应用成果。了解在应用情景中发生作用的机制是人的因素研究领域中的重要方面。
用户第一
在人的因素中,第一条需要遵守的原则是“用户第一”。假如从现在开始在25年间关于人的因素方面你首先应该记住的只有一件事,那么它是“用户第一”。其他的一切都是围绕这一主题展开的。
在你承诺做到“用户第一”以前,你首先必须知道谁是用户,不同的用户群对人的因素有不同的要求。比如,当日本人生产第一辆汽车时,它是为日本公民设计的。当汽车出口到美国后问题便出现了,美国的男人们如果不同时压离合器和加速器便无法踩刹车使车子停下。看起来,这种设计的不足是很明显的。一般而言,美国人比日本人高大并且有一双大脚。尽管刹车踏板对长着小脚的日本人而言是很舒适的,但对长着大脚的美国人来说,则显得太窄小了。其原因就在于在初始设计时并没有考虑到美国人的特征,这样便违反了人的因素中的第一条规则——“用户第一”。
在更高级的领域里同样的错误也会发生。一个很大的美国电信通讯公司对人的因素有高度的重视。它为了满足用户的要求正欲设计一个提供电话登录信息系统。由于用户对硬件的要求已经明确提出了,因此人的因素设计者们只得拿出小型计算机语言的等价物,使用时用户只需输人适当的命令即可。基于此,计算机科学家应邀来编制这种新的微型语言。通过几个月的努力,他们发明了一种应用范围很广的语言,能够快速、有效地处理登录信息。不仅如此,精明的设计者们还通过让秘书作测试被试检验了他们的新系统。由于这种装置是为秘书设计的,所以设计者们以秘书作为测试被试是很理想的检验。可惜的是,没有一个人能够掌握这种新的语言系统。经过一段时间的思考,设计者认识到需亲手指导用户进行操作。于是,他们又用了几个月的时间结合实例进行了讲解和详细的说明。第二次的检验发现,一些秘书人员尽管能够运用该装置,但是大多数人仍比较迷惘。设计者对此很不满意并仔细咨询了那几个成功操作的秘书。现在问题明朗化了。设计者,也即电脑编程人员,编制了一个系统,而该系统只对那些思维方式与他们类似的用户才是最理想的。但是大部分用户是缺乏计算机技术的。因此,设计者又发明了一个新的效率较低的语言,该语言在完成给定的登录计划表时需要很多的指示。但是这种新语言易学易用。最后一次的检验表明大多数的秘书人员现都能够使用这一办公系统。第一次检验后设计者所进行的培训,无疑是以缩短电脑程序的长度为出发的,这种思维定势使他们忽略了“用户第一”的守则。他们的设计与其说为了用户不如说为了自己。但是最终灾难被避免了,因为设计者是聪明的,在他们将其产品推向市场前,先在用户中进行了试验。所以,“用户第一”原则的一个很重要的方面是必须在最终消费该产品的用户群个进行试验。
违反“用户第一”的最后一个案例是关于机床的设计(见图15—1)。在这里,用户群是已知的。但是正如图15—1表明,此类设计的机床需要一个躯干很短但手臂极长的人来控制。然而生活中没有这种尺寸的人,这个例子说明改变机器要比改变使用机器的人容易得多。
生命的价值
人的因素中一个很重要但也很容易被忽略的主题是生命的价值。将经济价值与死亡联系在一起看来很滑稽,但实际上,每当劳动者(工人)想知道安装到系统上装置的安全系数和需要什么种类的安全告示时,经济价值与死亡是一直联系在一起的。没有任何一种产品是绝对安全的。即便是一颗很小的纽扣,若被婴儿吞下去也是致命的。人们对一家美国汽车制造商所作出的在所有的1990—型汽车中装保险袋的决策的经济效用会作出怎样的评估呢?
人的因素学会的主席在其就职演说(Parsons,1970)中对生命与死亡进行了讨论。人的生命价值可以通过多种方法来评价,从由人体中提炼出的几分钱的化学产品到30多枚的银币再到政府首脑生命的上百万美元的保险政策不等。据帕森斯估计,阿波罗号宇航员如能成功地按期飞回地球,每个宇航员花费美国纳税人5亿美元的费用。尽管帕森斯牧师不提倡让阿波罗号自生自灭,但是很明显,并不是所有人的生命都是等价的。
由帕森斯倡导的人的因素研究很重视人的生命与死亡的价值。通过对警戒符号和标记的研究,研究人员能够改善设备的安全性能。通过消除造成飞机失事和化工厂爆炸的人为原因,就可拯救人的生命。改善人的潜在生命质量,这对人的因素的研究者来说是一个很重要的回报。
一、人的因素实验中的变量
(一)因变量
在人的因素的研究中,最通用的因变量是错误率。作为一门学科,减少错误率是人的因素研究中显而易见的主要目标。时间也是一个很重要的因变量。测量完成一项任务的总时间常常与部分时间一起作为测量的参数,如反应时和运动时等。在现实生活中,对事件的延迟反应等同于错误。例如,如果你决定在汽车靠近一个悬崖时停车,但是由于你的反应迟钝以至于就在跌落悬崖之前才踩刹车间而没能达到预期目的,这等同于没有刹车。
(二)自变量
人的因素学家研究问题的范围很广致使许多的自变量被研究了。对空难中视错觉作用感兴趣的研究者,可能会与研究知觉的实验心理学家一样,研究相同的自变量。同样,对训练感兴趣的人,将会操纵一些诸如练习、练习的分配及呈现通道等与记忆研究者相同的自变量。而研究心理负荷的人的因素科学家则会与研究注意的实验心理学家使用相同的自变量。
然而,在人的因素中,关注原子能工厂、军事指挥、控制和通讯等复杂系统的专家,可能会以与社会和组织心理学家或社会学家所用的类似的方式去操纵小组中的交流路径。环境自变量,比如噪音、温度以及振动等,在应用的情景中,都是有趣的和有用的。被试变量、如具有不同领导风格的人们,可能会被选出来。另外,在人的因素研究中,一天中工作和时间的变动计划表也可以被操纵。
(三)控制变量
在许多应用研究中,虽然有控制变量,但总是很少。此类研究大部分都是在现场进行的,现场的情景不利于实验室研究中经常能够做出的那些实验控制。基于此,研究者在确认潜在混淆变量时必须要小心,因为这些混淆变量很可能会导致实验结果的其他解释。比如,当有关的外部变量被迫变化时,它们也许掩盖了真实的处理结果。
二、实验主题:小样本设计
范例:动态视敏度
现实生活中有许多情景需要对移动的目标物进行觉察和识别。棒球场上的中锋在迎接远处飞来的球时,他首先必须在其视野内发现目标物(棒球),才能够判断球的落点。在密集航线上驾驶飞机的飞行员必须时刻注意航线以避开迎面飞来的其他飞机。一个宇航员在试图停泊宇宙飞船时必须觉察飞船和泊位之间的相对运动情况。在高速公路上一个汽车驾驶员若想起车,必须觉察邻近汽车的情况以确定是否能安全超过。所有这些部属动态视敏度的案例。
动态视敏度被定义为知觉运动物体细节的能力。它是相对于静态视敏度面言的,静态视敏度是指知觉静止物体细节的能力。视敏度通常通过呈现带小缺口的字母C(被称为兰道C型视标)来测量(见图15—2)。若缺口大,很容易被注意到;若缺口很小,字母C会被当成字母O。缺口的大小是人们对字母C与外表上很像的字母O作出可靠辨别的视敏度指数。若兰道C型视标静止不动,我们测量的就是静态视敏度。若兰道C型视标有运行轨迹,我们测量的则是动态视敏度。当你在配镜师的办公室里看斯内伦视力表时,测量的是你的静态视敏度。
虽然动态与静态视敏度是相互关联的(Scialfa,Garvey,Gish,Deering,Leibowitz,和Goebel,1988),担如果用静态视敏度去预测动态视敏度会产生技术问题。因此.为了测量某人是否具有成功地从事某种需要良好动态视敏度的职业的能力,谨慎的研究人员会直接测量其动态视敏度。不仅如此,动态视敏度还在设计复杂系统方面具有很重要的意义。设计者通常有一个选择标准,即他们倾向于那些易于检测和辨认的移动目标。
目标物波长对动态视敏度的影响
正如许多有趣的人的因素问题一样,颜色对移动问题的解决所产生的影响无论是理论上还是实践上均具有重要的意义。设计决策涉及到各种不同范围内的项目,比如,计算机显示器和街头的一些标志牌,关于某一特定颜色更容易被知觉到的知识,在一定程度上会影响设计决策。理论上,人们知道蓝色的锥体颜色感受器与其他的颜色感受器差异很大,它有着较低的静态视敏度而且惰性更强Long和Garvey,1988)。因此,朗和加维(1988)认为,研究颜色的波长对动态视敏度的影响,无论从实践上还是从理论上都是很有必要的。在他们的研究中,只有两个男性观察者接受了所有的实验条件。这两个观察者在戴眼镜时的静态视敏度均是20/20,当然眼镜是在实验中被戴上去的。尽管这是一个很小的研究样本,但是,每个观察者均在为期12个月的时间里参加了40-60分钟的测试。使用小样本设计,并不是为了最大程度的省力。相反,被试是合适的,因为他们是在高度控制的实验情境中接受测试的,并且在这种情况下,数据根容易被重复测得。
实验
兰道C型视标被投射到一个白色屏幕上。波长或颜色是一个自变量,四个兰道C型视标共有凹种波长,分别是白、蓝、黄、或者红色。兰道C型视标的缺口有四种可能的位置:左上、右上、左下和右下。缺口的位置随机变化,每次实验均不相同。若想回答正确,被试必须报告缺口的位置。图15—2表现了在实验中所使用的缺口大小的样本。本实验使用了极限法来确定阈限或被试能够正确辨认缺口位置的最小缺口尺寸。缺门的尺寸是第二个自变量。每次实验进行时,常常是以一个较大的缺口开始的。如果接下来的反应正确,那么缺门的尺寸将会减小。这种做法一直持续到出现不正确的反应为止。然后,缺口的尺寸再随测试的进行而逐渐增大。如此重复多次。当被试对给定的缺口第二次作出错误判断时,相应条件下进行的测试便停止了。阈限就是或前或后与之毗邻的那个较大缺口。
另一个重要的自变量是观察者眼睛的适应水平。夜间观察时,视觉被视杆细胞所控制,称为暗视觉。在明亮的光线下,视觉被视锥细胞所控制,叫明视觉。视扦细胞和视锥细胞对波长或颜色有不同的敏感性。即使视杆细胞无法辨别确定额色,它们仍然会对各种不同的波长以不同的敏感性作出反应。所以,在暗视觉下,研究波长的效应是明智的,因为在这种情况下,视扦细胞的作用占主导地位;而在明视觉条件下则相反,视锥细胞支配着视觉,占主导地位。在本研究中,用夜晚观察条件来产生暗视觉,而用白天观察条件来产生明视觉。
最后,我们将要讨论的第四个也是最后一个的自变量是目标的移动速度。根据早期研究中使用的值,以及在选择速度范围时人们考虑到的目标移动对视敏度的不利影响,本实验中选择了角速度的三个值。
朗和加维(1988)分别检验了两个被试者的数据资料,因为小样本研究不能在不同被试问计算平均数。他们发现,随着目标速度的增加,朗道(缺口尺寸)也会增加。速度越快越难以知觉到。在夜晚的观察条件(暗视觉)下,蓝色目标物有较低的朗限,比其他颜色的物体如白色、黄色或红色易于被知觉到;而在白天的观察条件(明视觉)下却不然。
这些实验结果在实践中是很有意义的。例如,红色照明通常用于保持人们的暗适应(即使一个人的眼睛在黑暗中能够看到东西)。朗和加维的研究表明,蓝色照明而不是红色照明易于使人的视觉识别黑暗中移动的物体。
三、实验主题:因变量的选择
范例飞行员的心理负荷
东方航空401航班即将飞抵迈阿密国际机场时,飞行员突然发现前轮指示灯还没亮。机组人员试图确定这一问题是信号灯本身的原因还是前轮没能落下或锁定在着陆时的位置,而与此同时,飞行员只得转向并且从低空飞过了埃弗格拉兹。尽管一个前轮失灵的着陆滑行并不是很危险,但假如信号灯事先早巳正确显示前轮失灵的信号的话,那么,机组人员自然就会用人工的方法放下前轮了。
此时飞机在自动飞行仪的控制下继续飞行,与此同时,三个机组人员都在竭力察看是否灯泡出了问题,并试着前轮能否放下来。然而,令机组人员意想不到的是,自动驾驶仪突然失灵了,飞机开始缓缓地下滑。机组人员的注意力完全集中在信号灯上,过了很长时间副驾驶员才注意到高度测量表。在离飞机坠毁还有8秒钟时,机组人员没能采取任何措施拉高飞机。导致这次99人死亡的机械故障仅仅是一个饶坏了的灯泡。这次灾难的心理原因是注意的心理过程。机组人员费尽心机、全神贯注地试图解决信号灯的问题,以至于没有人去注意飞机驾驶和飞行高度监控等更为重要的问题。
关于注意力分配和集中的基础研究所提供的模型和资料就直接与这类实际问题有关。但是这类研究的实际效用不能在实验室中得到评估。因此需要现场研究去验证在大学实验室所作出的研究成果是否在现实的世界里也起作用。就航空学来讲,在飞行中的飞机上进行这种现场研究其代价是很昂贵的,并且也是很危险的。因此,大部分的现场研究是在飞机模拟器中进行的。这些模拟器是那样的逼真,以至于联邦航丰公司用它进行职业飞行员的培训和鉴定工作。在航空学中,模拟飞行器为精心控制的实验室研究与真正的航行之间建起了桥梁。我们先回顾一下在加利福尼亚的国家航空和宇宙航行局(National Aeronautics and Space Administration,简称NASA)的艾姆斯研究中心(Ames Research Center)飞行模拟器上进行过的系列研究,然后再结合位于艾姆斯的飞行燎望台处进行的现场研究得出结论。我们的目的是说明如何测量和评估飞行中所需要的注意力,即工作负荷对飞行员控制飞行模拟器能力方面的影响。
国家航空和宇宙航行局的GAT实验:在飞行模拟器里测量工作负荷
自1983年开始.在国家航空和宇宙航行局(NASA)的航空训练总部(General Aviation Trainer,简称LAT)进行了一系列的飞行实验。这是一种相对不太昂贵的模拟器行器,在这里训练飞行员驾驶单一引擎的飞机飞行。模拟飞行器安置在一个可以使飞机座舱随飞行员而活动的底座上。座舱的窗户通常被覆盖着,所以飞行员必须依靠仪表上的读数来操作。
一般而言,这种研究的目的就是提供心理负荷测量的客观方法,尤其当使用次要任务法时。所谓次要任务就是在执行重要任务(被称为首要任务)过程中临时插入的一项无关任务。通常,完成次要任务的成绩可看作是完成首要任务所需要的注意力的指标。如果次要任务的成绩不好,那么对首要任务而言这可能意味着需要很强的注意力或者心理负荷。问题是如何运用已完成的大量注意力研究成果来帮助解决飞行现场的实际困境。
实验心理学家在实验室里完成的许多注意力研究方面的成果表明,次要任务是研究注意力负荷的有用指标。当前所面临的挑战是对基础研究知识的运用,因为绝大部分基础研究知识并不是为了解决不远的将来真实世界中发生的任何实际问题而诞生的。GAT环境是介于严格控制的实验室和真实的飞机之间的合理折衷。
飞行员上作负荷的现场研究既使用了主观的因变量也使用了客观的因变量。客观测量包括诸如反应时和正确率等这些很容易被实验人员核对的变量。主观测量就是一种在等级量表上结出的言语报告,比如,要求飞行员在从1-10的量表上判断其工作负荷。主观评定未必能被实验人员核实。但是,在20世纪80年代的早期,在飞行模拟器里研究工作负荷的研究人员(心理学家),在寻找满意的客观测量手段方曲遇到了一些麻烦。这类研究要做许多主、客观方面的测量。通常是找到能产生显著变化的主观变量,但是有用的客观测量却很少。研究表明,在找到的大量测量中,如果有一项研究能提供可靠的统计结果就很不错了。所以,研究者们喜欢主观测量手段胜过客观测量手段。这种偏好是易于理解的。因为没有人想浪费精力去做没有意义的事情,即无法满足统计需要的事情。
理论假设
航空中人的因素的主要问题是缺乏有意义的理论框架以帮助指导研究和实践。大多数的心理学文献似乎跟实际工作者毫不相干;所以,以前的大多数关于心理负荷的研究也并没有以任何理论观点为依据。于是人们采纳了一种宽松的工程学方法,该方法的使用是基于这样的一个前提,即如果有足够的客观测量被研究,那么研究人员就会发现飞行员心理负荷影响所产生的效用。尽管研究者们在复制注意的实验室研究方法方面做了一些思考和尝试,但有关这些方法的理论启示却几乎没有人费力地去理解过。
一个常用的次要任务是选择反应任务。在选择反应任务中,可能会使用几个刺激(如,不同频率的音);每个刺激均有它自己的独一无二的反应。因为选择反应需要一定的注意力.所以它总是存在干扰首要任务的危险。如果这种情况发生,首要任务的操作将会受到损害,并且我们也将无法得出首要任务的注意力需要方面的任何结论。幸运的是,飞行员都受到过相当好的训练。他们已经学过无论发生什么意外的事情,他们的第一责任都是驾驶飞机。回想前面说过的401次航班就是没有遵守这一规则以至机毁人亡。
实验
在模拟器里人们通常用选择反应任务测试飞行员。这种实验的主要目的是(1)发现选择反应的次要任务是否对首要飞行任务不产生干扰;如果干扰不存在,那么(2)看一看它是否可以充当测量飞行员心理负荷的一个合适的因变量。在这里,我们并不打算讨论所有的结论;有兴趣的读者可以看坎特威茨、哈特和博特卢西(1983)发表的研究报告。
本研究所使用的次要任务由两种或者四种音调组成。(两选和四选任务同时使用的理由与相应的一些理论问题有关,该理论问题超出了本章所涉及的范围,参见Kantowitz和KnZght,1976。)飞行员通过按压其左侧拇指处的转换器来对声音作出反应,反应的合适与否依赖于音调的变化。在模拟飞行器里每22秒钟出现一个声调。
每一个飞行员在模拟飞行过程中的路程都是难易相间的,每次飞行持续22分钟。情景(路况)的设计是以先前的等级数据为基础的,每个模拟情景飞行三次:一次是只有首要任务,作为控制条件;一次是附带一个两选的次要任务;另一次是附带一个四选的次要任务。
图15—3表明,飞行任务的错误率是次要任务水平的函数。就像预期的那样,难度高的飞行情景显示出了较大的错误率。最重要的是次要任务效应。适宜的统计分析显示出,图15—3两条曲线基本上是乎缓的。在没有次要任务条件和有一个两选或四选次要任务的条件之间没有什么统计上的显著差异。因此,关于飞行员首先驾驶好飞机不让次要任务干扰主要飞行任务的关键假设被证实了。
图15-4表明了次要音调任务卜的成绩是飞行片段的函数。纵轴表示每秒钟所传递的信息,以比特(bits)为单位。这是一种既要考虑速度同时又要考虑反应准确度的测量。高分代表着高的操作水乎。图15—4上每个点之间确实存在可靠的统计差异。尤其是飞行的最后片段得到的最低分数。这意味着在飞行的这一片段注意力和心理负荷均最大。相对而言,在本飞行片段中对次要任务中的注意确实是较少的,所以每秒的比特数很低。这一结果飞行员也能直觉地感受到,因为飞行员们相信在着陆的过程中心理负荷是最高的。然而,他们的观点带有主观性,图15-4中的客观结果并不是以此为依据的。
简短的实验描述表明了理论的确是实践的工具。在GAT模拟器中,尽管实验情景比产生理论的实验中环境要少一些控制.但我们仍然能够通过使用选择反应而得出飞行员工作负荷的客观测量。我们也发现,飞行员就他们的心理负荷所作的主观报告或观点与客观的选择反应测量一致,即两者会聚了。主观与客观
测景的会聚使我们更加确信降落引起高心理负荷这一结果了。
测量空中飞行员的心理负荷
图15—5是NASA凯功(Kuiper)机载嘹望台。它是一个“飞行的望远镜”,可以使飞航员到达10,000英尺以下的地球大气层,大约85%的地球气体在脚下,因此能获得较理想的天体事件的图像资料与天文台的定期观察相一致,心理负荷的研究者们能够从四个方面继续检测飞行员的心理负荷:通讯分析、对心理负荷的主观等级评定、对与心理负荷相关的额外因素的主观等级评定及心律(Hauser和Lester,1984)。
由于心理负荷的研究不能十扰止常的飞行彬序,所以研究人员在研究方案的设计上不得不受些限制。例如,为了安全起见,在起飞和降落时除心律外不能做其他测量。另外通过引进次要任务来获得客观资料也不现实。虽然如此,一些有用的信息仍可得到。最有趣的结果是飞行员和副驾驶员在平均心律上存在差异。飞行员,由于对飞机的安全飞行负责,比副驾驶员的心律高得多,因为副驾驶员只负责航行和通讯。这个差异并不能归结为训练上的不同,因为所有的飞行员都是很优秀的;实际上,一个人在这次飞行中是副驾驶员而在另一次飞行中可能是飞行员。然而,实际飞行安排上的这些难题就会给完整的实验设计带来障碍,因为机上所有的飞行员既在正、又在负驾驶员的位置上均能被检测是有很多困难的。同样,要获得飞行员未飞行前的基线心律资料也是不可能的。飞行员的心律(每分钟从72到87)有很大的差别;对副驾驶员而言,则没有这么大的增幅变化。然而,从心理负荷的主观估计看,尽管整个飞行片段间情况明显地不同,但是在正、负驾驶员之间却没有什么差异。
就像大多数对飞行员心理负荷的研究一样,对这些结果的解释并不像实验室或模拟器里的研究那么容易。心律对肉体上付出的努力是很敏感的:对飞行员而言,较高的心律更可能反映生理活动而不是心理活动。心律的变化被用来测量心理负荷,而心理负荷却较少受到肉体努力的影响,但是研究人员并没有报告变化的结果。最理想的方法看起来就是在实验室和模拟器两种情况中把客观的、主观的和生理的测量方法结合起来。客观测量结果能用来校正那些更适合其他的飞行中的测量结果。在测量飞行员心理负荷方面,未来的进步取决于现有结果与注意理论的连接。而这并不是一个容易完成的任务,它需要基础研究者和应用研究者之间的更好合作。
载重车司机的工作负荷
用于测量飞行员心理负荷的方法已经成功地应用于职业卡车司机心理负荷的测量上了。正如上面提到过的,测量心理负荷的主要假设是次要任务的插入不会改变首要任务的操作成绩(见图15—6)。尽管这个假设对职业飞行员而言确实是真实的,因为他们在取得职业资格证书之前进行过大量的专门化训练,但是这并不能保证它对卡车司机也适用。
坎特威茨(1995)在驾驶模拟器里,用那些持有卡车营业执照的司机做被试,对这一假设进行了检验。首要任务测量的是车道状况和车速。当次要任务介入时,它们没受到影响。因此,有关职业卡车司机的主要假设被满足了。研究中使用了两个次要任务。在速度计任务条件下,要求司机读出车辆的行驶速度,该速度计被事先安装了四个速度的值从1000、2000、3000到4000。方向盘上装有四个挡的开关(调节器).司机只要压其中的一个就可作出反应。在瞬时记忆任务中,要求司机背读听到的七位数的电话号码。
图15—7表明,读速度计任务条件下的反应时受交通密度和路况的影响。统计资料显示出显著的交互作用,即司机的工作负荷在车辆多、弯弯曲曲的路段最高。图15—8表明,交通状况好、车辆少的情况下瞬时记亿较好。这意味着在拥挤的交通中司机的工作负荷较高。
这些结果表明驾驶员工作负荷的概念并不仅仅局限于飞行员。成功地测量飞行员心理负荷的工具和技术同样可以用于驾驶模拟器的研究中。然而,在我们能够把工作负荷概念完全推广到地面车辆的驾驶员身上之前,必须要在公路上对载重车司机的工作负荷进行测验
四、实验主题:言语报告
范例:年长司机的驾驶作业
交通安全问题是人的因素心理学研究中的主要领域,而且也是一个几乎影响到我们每个人的问题。自本世纪初第一辆汽车发明以来,随着汽车数量的不断增加,交通事故也在相应地增加。对人的因素进行研究的心理学家而言,降低年长司机的事故风险已成为一个挑战。年长司机是快速增长的司机队伍中的一个主要部分(Waller,1991)。而且,他们经历了许多的事故,其中许多事故还是致命的。除16—25岁的司机外,他们的事故发生率比所有其他年龄段司机要高得多(Laux和Brelsford,1990)。这一领域需要解决的问题很多很多,以至于人的因素方面的心理学主要刊物—《人的因素》(HumanFactors)——每年都要出版专集,专门研究改进车辆设计方法和公路标牌以及延长年长司机在公路上自由行驶的时间等问题,以减少事故发生率。
预测40岁一92岁年龄段司机的驾驶作业
劳克斯和布里尔斯福德(1990)进行了一项由AAA交通安全基金会赞助的相关研究。其目的是了解年龄本身是否能较好地预测驾驶问题;或者说,是否个体的认知和生理能力在驾驶过程中更合适预测谁的风险较大。
在这项研究中,司机的年龄是一个被试变量。自愿的司机被分为两组:年长组(50一92岁)和年轻组(40一49岁)。一个因变量是司机的每日驾驶清单(DailyDriverChecklist,简称DDC)——一种对驾驶作业的言语或自我报告的测量(见图15—6)。司机在三个月中每日填写一个清单,在此清单中记录下驾驶次数、天气情况以及“接近失误”(例如,没有看见另一辆车而险些与之相撞或误定单行道)的次数等。劳克斯和布里尔斯福德(1990)之所以选择DDC作为测量
驾驶作业的手段,是基于一个假设,即交通事故很稀少以至于只得研究“接近失误”。进一步讲,他们相信经历过许多“接近失误”的司机会有较大的风险遇上一次真正的交通事故。为了得到对驾驶作业的确切评价,劳克斯和市里尔斯福德要在一个相当长的时间——三个月——里记录驾驶行为。这一持续的时间过程排除了研究助手客观记录驾驶信息的可能性。当研究受到限制时,DI工作为言语报告的测量方法是惟一可行的选择。
除了评估驾驶作业外,劳克斯和布里尔斯福德还在其他方面对司机进行测试,如;感觉、认知心理运动及生理功能等。40岁左右的人,在觉察视觉刺激方面的能力会下降,这是感觉功能上的缺陷。认知功能也呈现出一个与年龄相关的大下降。例如,年长司机在环境中对刺激的觉察和反应要慢得多。达对于那些生活在繁忙的城市中的年长司机而言是一个潜存的严重问题。心理运动测量的是每个司机的抓握力量及其颈项和躯干的灵活度。心理运动功能可能在躲避人为事故方面(例如,避开洞穴及突然出现的汽车等)起着很重要的作用。最后,劳克斯和布里尔斯福德(1990)对司机的整体健康状况及正遭受的健康问题进行了调查,以探讨生理健康而不是年龄对驾驶作业可能产生的影响。
总之,有足够的资料证明年龄与感觉、认知、心理运动能力和身体功能的下降之间存在着显著的相关。尽管存在与年龄相关的下降,但年龄并不能预测驾驶作业。对这一明显的相互矛盾的可能解释是,年长司机报告说,他们驾驶的次数较少并且尽量避开要求较高的驾驶环境(例如,高速公路、交通的高峰时刻和云雾天气等)。
劳克斯和布里尔斯福德总结道,虽然在感觉、认知、心理运动和身体素质方面存在着与年龄相关的变化,但正如DDC所测出的,年龄并非是预测驾驶作业的重要因素。简言之,年长司机很可能认识到了自身年龄的局限性并采取了措施以减少他们的驾驶风险。也许,这使得他们把可能遇到的困难或“接近失误”的次数降到最少。
诸如劳克斯和布里尔斯福德的研究是很重要的,因为它们使我们知道了年长司机所面临的问题。这一研究表明,增加交通安全的首要问题是降低对年长司机的要求,以便于他们能够继续安全驾驶。因此,保持司机的充分自由度对他们自己和家庭而言都是很重要的。
五、主题:现场研究
范例:中央高位刹车灯
就伤前面的研究所提到的一样,交通安全是人的因素心理学家日益关心的主要问题。美国人对汽车的偏爱并没有因为汽车操作成本的上升、空气污染、许多大城市里的拥挤和交通事故的不断发生等而下降。交通事故对我们城市里的年轻人构成了严重的威胁,机动车相撞成为4—35岁年龄段美国人死亡的首要因素(McGinnis,1984)。如果你的汽车是1986年出厂的或是更迟些,那么你是人的因素心理学家的研究成功经历——中央高位刹车灯——的直接受益人之一。发明这种灯的动力来源于25%之多的汽车失控事件和7.4%的致命事故都涉及追尾事故的发生。在1977年的早些时候,马隆(Malone,T.B)和柯克帕特里克(Kirkpatrick)进行了一个涉及华盛顿地区出租车在内的现场研究,以测验刹车灯的不同外形与汽车追尾相撞事故之间的关系。马隆(1986)在人的因素学会的学报上概括讲述了这个研究的情况。
刹车灯的格局和追尾碰撞事件的发生
马隆和柯克帕特里克将2l00个出租车司机均分为四组:三个实验组和一个控制组。依据年龄、性别和有无事故的历史对司机进行匹配。自变量是车尾部刹车灯的安装情况。安装格局有四种。控制条件是在汽车较低的两佣安装两个刹车灯。三个实验测试刹车灯包括:(1)汽车中央的高位刹车灯,(2)独立的双高位刹车灯和(3)一个把现在的(层灯)功能从刹车和转向功能区分开的独立功能条件。
因变量是在一年中发生的追尾碰撞事件和行驶里程。在研究中,出租车司机在不同的路况和气候的情况下共行驶了6000多万公里。
马隆和柯克帕特里克发现,用中央高位刹车灯的司机比安装其他形式刹车灯的司机经历较少的追尾事件。图15—9显示了四种实验情况下的事故数量。正如你所见到的,在中央高位刹车灯情况下的司机比控制条件(现存的刹车灯格局)下的司机出现的追尾事件少54%。当事件发生时,有中央高位刹车灯的车能使事件的破坏程度降低38%。马隆和柯克帕特里克推测,这种刹车灯的格局导致尾随车辆的刹车发生得更快,从而降低了相撞时的速度和彼此的破坏程度。当出租车装上中央高位刹车灯后,是什么使得尾随车辆的刹车加快了呢?马隆和柯克帕特里克推测是由于中央高位刹车灯的格局接近个体正常视线的缘故,也就是说,它刚好位于司机驾车对通常看到的位置。这一研究有助于改变所有在美国销售的汽车刹车灯的格局。现在所有新车均要求配备中央高位刹车灯。
遗憾的是,最近的研究发现高位刹车灯并不是任何情况下都能使事件减少50%(Mortimer,1993)。它的实际收益范围是22%-35%。一份来自保险公司的汽车相关资料显示仅仅有5%的收益(Farmer,l995)。我们不知道为什么收益比预测的少得多。这种状况的部分原因也许在于新奇性:随着安装高位刹车灯的车辆增多,司机们会变得越来越习惯它,于是此种刹车灯的效用减小了。尽管如此,在汽车刹车灯问题上有关人的团素的研究将继续证明中央刹车灯的益处。
人的因素是心理学中激动人心的和具有挑战意义的研究领域。许多的研究人员选择这一领域是因为有将实验心理学的原则应用到人的日常生活中去的机会。本章所阐述的研究反映了这一普遍方法。例如,朗和加维(1988)就将心理物理学中发展出来的极限法应用到了目标物波长对动态视敏度影响的研究中。马隆和柯克帕特里克应用知觉的基本原则去测试中央高位刹车灯。按照支持心理学研究的社会人士的评价标准,归根结底,实验心理学家是否成功要看其研究与社会问题的关联程度。就像你在这一章里所见到的,人的因素心理学家已经在这些问题上取得了成功。
小结
1.人的因素是一门试图寻找人和技术之间最优结合的学科。许多人的因素研究者和实践者均源于实验小理学的训练。然而,人的因素的研究范畴却远远超过了实验心理学。
2.人的因素的主要原则是“用户第一”。因为人是各种各样技术系统中最基本的成分,如若不能叫了人作为系统一部分的功能,那么我们在技术系统方面便不能有任何的改进和提高。
3.在许多人的因素的情境中,心理学研究中传统的大样本设计研究方法己不再适用。动态视敏度是最适合使用心理学研究技术的人的因素的一个研究题目。颜色和运动速度影响动态视敏度。
4.人的因素的实验可以在实验室、模拟器或者工作现场中进行。为了安全和经济的原因,在模拟器里进行的研究主要用于航空和原子能等方面的研究。
5.在研究心理负荷时使用主观和客观的测量。主观测量较易获得,但客观测量更容易被研究者认同。
6.无论是基础研究还是人的因素研究,理论都具有同样重要的指导作用。颜色视觉模型已被用于研究动态视敏度了。注意模型在指导心理负荷的模拟器研究中也是很有用的。
7.人的因素心理学家对交通安全日益关心。在调查年长司机井维护其安全的研究中,使用了言语报告法。对此很多人提出了反对意见,但是,在一些情况下很难获得客观的测量。不过,在对减少事故的最好刹车灯格局的人的因素的现场研究中.使用了一个客观的测量——具有各种刹车灯格局的汽车的交通事故数。
实验设计练习
问题:测量飞行员空中的心理负荷
现场研究几乎总是有一定的限制,以至于常妨碍实验室方法和结果的直接应用。尽管我们在实验室中能够测量心理负荷,并在模拟飞行器里也取得了一定程度的成功;就目前而言,还没有一个能被普遍接受的持续监测飞行员心理负荷的空中技术。
问题:寻找一种测量空中飞行员心理负荷的不干扰方法
这里的关键词是不干扰,意味着我们的方案不能干扰正常的飞行,所以最好的实验室技术,即使用一个客观的次要任务必须被排除在外。在高心理负荷下,分散到次要任务上的额外注意可能会对安全不利。同样,让飞行员不断地在飞行途中报告他们主观的工作负荷的等级也遇到了安全问题的质疑。
这意味着生理测量也许更适宜于做因变量。如果在飞行员身上埋置无痛电极以测量心率或脑波的话,飞行员的飞行将不会受到干扰,此种方法称作生理测量。
假设:脑波可以标示出空中飞行员的心理负荷
这一假设比它乍看起来的表面现象要复杂得多。主要的实验问题是如何计算脑波。记录脑电波(称为诱发电位)的技术是通过把表面电极无痛埋置于颅骨面实行的,并且已被广为接受了;但对这些信号的解释完全是另一回事。诱发电位包含了许多的成分;因此需要老练的计算机程序从电子噪音中把真正成分区分出来。甚至在这些成分被正确地辨认和记录之后,仍需要它们与飞行员工作负荷相关。
为了进行讨论,假定我们能够锁定一些特定的诱发电位成分,并且可以在飞机上安装一个体积小功率大的计算机系统,以便于持续地记录正、副驾驶员的脑电波。我们想要演示随飞行员心理负荷的加大,诱发电位也在逐渐增大的趋势。我们也可以预言正驾驶员比副驾驶员的脑电波幅度大。
我们的实验设计细节可能要视特定的飞行要求而定。现场研究者通常没有办法奢望飞机的飞行符合他们的研究需要。相反,对问题的研究必须要时刻注意适应飞行任务。这在很大程度上束缚了实验的设计。我们希望能够确认从飞行员的起飞、飞行、降落等不同阶段的测量以便提供飞行员在全过程中不同的心理负荷水平。当然,我们还要使用前人已经发表的研究结果以计算工作负荷与飞行阶段的相关。
如果我们的实验开始了,那么最大的脑电波将会出现在飞行的最艰难阶段。如不这样,那么在这一研究领域就可能有许多潜在误差源,以至于即使我们的假设正确也可能无法产生相应的结果。或许飞行阶段不足引起飞行员工作负荷的不同;或许选择了错误的脑电波成分;或许我们没有得到足够的数据来对我们预想的结果进行有力的统计分析;或许我们选择的飞行员样本太少了;或许相对于飞行任务而言飞行员的技术水平太高,以至于他们的工作负荷始终处于低水平阶段而绝不会出现超负荷现象。当然,还有许多其他方面的问题也可以一一列出。