第17章环境心理学实验 一、目的要求: 了解环境心理学的实验研究 二、讲授内容: (一)引言 (二)变量介绍 (三)实验主题与研究范例 一、环境心理学研究的变量 (一)因变量 环境心理学家除了记录可观察的行为之外,还常常记录感情和情绪。这些内部状态可由等级量表推论而知。因此,一项对拥挤的研究可能会让人们评定诸如他们对研究中其他人的观点、体验的舒适性以及对房间大小的感觉等事情。然而仅仅用一些描述性的名称来标定一个量表,并不能保证这个量表可以测量,并且仅可以测量人类经验的特定方面。试考虑如下的一个等级评定问题,对该问题读者必须在1—5的数字中圈出一个: 谈到形体的吸引力,我的合作者是: 非常漂亮 非常难看 1 2 3 4 5 被试的反映往往会受非形体方面的行为特征所影响。一位乐于助人和合作的合作者会被认为比侮辱人的和粗鲁的同一位合作者(在一个不同的实验条件中)在外表上更有吸引力。 (二)自变量 在有关拥挤、空间行为和领属范围中通常操纵密度,密度一般被定义为每单位面积上的人数,例如每10平方米6个人。由于我们可以统计人数、测量面积,所以,这样定义的密度满足了我们对一个清晰的操作定义的要求。因为密度有两个组成成分,所以我们可以用两种途径来操纵它。第一,我们可以使人数保持恒定而变化容纳他们的房间大小。第二,我们保持房间大小的恒定而改变房间内的人数。虽然乍一看似乎这两种对密度的操纵相同,但结果是它们在行为和感情上有不同的影响(例如,参见Marshall和Heslin,1975)。 所以这种普通的操作定义,尽管明确和清楚,但由于它混淆了两个独立的变量:人数和空间大小,所以是不完整的。例如,如果密度是通过保持房间大小恒定和增加入数来操纵的,那么我们不知道观察到的差异最好是归因于密度的影响还是人数的影响。由于心理密度常常是与物理密度不同的事实,故而这个问题变得更加复杂。被拥挤的感觉不但与物理密度有关,而且也与社会情境有关(Rapoport,1975)。一个拥挤的迪斯科舞会比同样拥挤的地铁车厢要感觉舒服得多。 环境心理学家们研究的另一类自变量可归为紧张刺激物类:那些引发紧张情境的动因。强噪音、高温及空气污染,都是这类自变量的例子。 (三)控制变量 环境心理学中进行的研究往往缺乏像心理学实验室研究中那样精心控制的变量。尽管环境的总体物理特征,如室内温度,是被控制的,但那些更细微的变量,比如参与者们的相对位置(肩并肩或面对面)却往往被忽视了。这一缺憾在现场研究中格外明显,因为现场研究的根本特点决定了它不可能允许实验者更多地控制环境。进行现场研究的环境心理学家们清楚地了解这一问题,但认为相对于更人为的实验室环境来说,现场情境在更大程度上的真实性是对这一缺憾的充分补偿。 二、实验结果的普遍性问题 任何实验就其本身而言是永无止境的。实验是通向预测和解释行为这一最终日标的道路上的台阶。除非过去实验的结果可以被应用到新情境中,否则实验毫无价值。所以建构解释电流的模型就不仅仅只涉及在实验室中研究的少量电子,而且也涉及你屋里墙上插座中的电子。 判定实验有用的一个重要标准是它的代表性。有代表性的实验可以允许我们把它们的发现推广到更多的普遍情景中去。当研究者们发现烟焦油会使实验狗致癌时,许多吸烟者认为这种实验只证明狗不该吸烟。简言之.他们怀疑这些发现的代表性并且不相信这些结果可以推广到人类。然而后继的研究证实了这些早期的发现。现在,一般的外科医生对吸烟的危害都深信不疑,以至于所有的香烟包装上都必须标上对消费者的警告。 香烟-犬实验是把从一个样本中得到的结果普遍推广到不同样本或不同人群的一个例子。我们把这称为样本普遍性。它以不同的形式出现。研究最多的人类被试是学习心理学导论课程的大学生,作为他们教育过程的一部分,他们常常被要求参与几个实验。假设我们刚刚完成了一个关于提高阅读速度和理解的方法的研究,所用的小样本被试来自赖斯大学选修心理学导论的学生。如果这样的研究得出了适宜的结果,那么它在教育上会有重要的意义。但是首先,在得出这些意义之前,需要回答几个有关样本普遍性的问题。第一,这些结果在所有选修心理学导论的赖斯大学的学生中是典型的或有代表性的吗?如果我们的样本只由男性被试组成,可能的回答为“不是”。即使我们的抽样程序使我们能够对第一个问题回答“是”,我们仍然没有摆脱麻烦。这些结果能在一般意义上代表赖斯大学的学生吗?同样,如果我们的样本仅仅由赖斯的新生组成,我们不能确保赖斯的高年级学生会得出同样的结果。而且,即使我们的结果可以推广到赖斯的所有大学生们,那么除非它能够证明全国的大学生都可以从中受益,否则在阅读方法方面开始一个较大的改变可能仍不值得。即使如此,我们可能还会怀疑高中和初中的学生是否也能应用这种新的阅读方法。很明显,一个单独的实验将很难推广到所有与此有关的群体中去。 关于自变量和因变量的普遍性也存在着类似的问题。环境压力可以被诸如提高温度、提高噪音水平以及在实验前的晚上剥夺一个人的睡眠等多种多样的方法来引起。由于我们关注的是一般意义上的环境压力,而不是噪音、温度和睡眠剥夺的具体影响,所以我们必须确保对这些相关的自变量的不同操作能够使得我们得出关于压力的有代表性的结论。我们把这称为变量代表性。比如说,我们关心气温对城市骚乱的影响:长期的炎炎夏日会导致攻击行为吗?当在实验室中研究这一问题时(Baron和Bell,1976),我们发现高温并不必然地导致攻击行为的增加,但在我们能够拒绝这一关于夏季城市问题的解释并转向其他假设(例如,在夏季的日子里,更多的年轻人在街上闲逛。)之前,我们必须确保自变量和因变量能从实验室中推广到城市的情境中。我们中的大多数人都愿意接受实验室中华氏95度的温度等同于城市街道中的相同温度这一主张,但是当我们涉及一般的实验室中的攻击性测量时,这一等同就不是那么明显了。 应用最为广泛的技术是让被试对一个研究的配合者施加一个电击,(参见图14-3)(实际上并没有施加任何电击,但实验者希望被试认为他或她正在控制一个电击。)更高的电击强度和更长的电击时间被认为是更强攻击性的证明。那么按一个钮所表现出来的攻击与向一个商店橱窗投掷石头或者用步枪阻击警察和消防队员中的攻击是相同的吗(图14-4)?尽管最终的结果——伤害他人——在实验室内外的攻击行为中看起来似乎是相同的,但城市的无序可能给攻击增加了另一个维度。在实验室中建立一个物理的模拟,如老鼠被训练得会“储藏”钱,并不必然意味着心理上的一致。正是在确定变量的代表性时的巨大困难使得许多环境心理学家从实验室研究转向现场研究,尽管事实上这样做的结果是较少的实验控制。 在本章中,我们介绍四项有关拥挤的研究并将详细考察它们的结果是如何被推广的。第一项研究以动物为被试,其余的三项都以人为被试。三项以人为被试的研究区别在于:一项是建立在社会学家们的人口统计数据的基础上,一项运用以实验控制代替过去的那种统计控制的现场研究技术,而另一项则是实验室实验。 动物中的拥挤:实验室研究 卡尔霍恩(1962,1966,1971)在国家精神健康研究所进行了一个长期的系列研究,得出了一些有关老鼠拥挤的长期影响的惊人发现。卡尔霍恩把他的老鼠放在一个有4个隔间的“老鼠空间”中(参见图14-5)。由于隔间l和4没有被连接起 来,于是它们成了死端,老鼠则聚集在隔间2和3中。这种过度的拥挤导致了一些病理行为的出现。在隔间2和3中,幼鼠的死亡率高达96%。雌鼠无法建造适宜的巢穴,并且常常丢弃幼鼠。这些幼鼠在它们被丢弃的地方死去,而且常被成年老鼠吃掉。高的死亡率对于老鼠的空间来说有极深刻的含义。雄鼠同时也表现出怪诞的性行为。最古怪的老鼠被卡尔霍恩称为“刺探者”。这些刺探者并不进行正常的鼠类求爱活动,它们会将雌鼠追逐到它们吃死去幼鼠的洞穴中。所以,自变量(高密度)导致了古怪的母性行为和性行为(因变量)的发生。 至少可以说、这些结果是极令人吃惊的。如果推广到人类的拥挤问题上,它们强烈地暗示了过度拥挤将最终毁灭我们今日所认识的社会。但是在我们为了宽敞的空间放弃找们高耸的公寓大楼之前,先让我们考虑一下对人类进行的一些研究。 人的拥挤:相关的人口统计学研究 卡尔霍恩用老鼠进行的研究意味着高密度导致病理行为。由于对于一位研究者来说,像卡尔霍恩拥挤老鼠那样把人长期拥挤在一起是极不道德的,所以一项类似于卡尔霍恩实验的直接实验验证是不可能的。但是,在我们的大城市中有一些社会形成的高人口密度区,观察这些现实世界中密度的影响无疑是合乎情理的。研究这种真实情境的优点是我们在推广结果的方面困难要小得多。例如,从一个城市推广到另一个城市比从—个实验室推广到一个城市的困难要小得多。不利之处是对白变量和可能的无关变量几乎没有任何实验控制。当实验控制不可行的时候,一个解决的方法是事后统计控制。 这就是埃文斯、帕尔塞思、莱波和马丁(1989)在印度普内研究拥挤和社会退缩时采取的方法。这些研究者假设,人们通过从社会交往中退缩来对待拥挤,而这将相应地削弱社会联系并导致更差的心理健康。通过一个涉及家庭和朋友关系的调查表(40个项目)来测量社会支持。通过询问是否在过去的两个月中曾体验过特定症状的附加面谈项目来测量心理症状。被试是175名居住在印度普内的男性家长。 评估结果的统计技术是相关。使用相关考察大范围的自变量,以避免产生低相关的全距限制是很重要的。因为研究是在印度进行的.居住密度从每个房间11人到2人,比在美国可以得到的典型密度范围大得多(Galle,Grove和McPherson,1972)。 图14-6表明了在密度和心理症状之间以及密度和社会支持之间的相关。两个相关系数在统计上均达到了0.05的显著水平。正相关表明密度的增加会伴随着更多的心理症状,而负相关则表明密度的增加伴随着社会支持的减少。这一种关系在图5中也同样显示出来了,在该图中密度被分成三类:低(每室少于1.6人)、中(1.6-3.25人)和高(多于3.25人)。 由于这是一个相关研究,我们不能就此认为人口密度会导致心理症状和减少社会支持。具有上述特征的人们会选择居住高密度房间在逻辑上是可能的。人口统计学研究不能像在实验室研究通常所做的那样将人们随机分派到不同的密度条件中去;然而,在考虑过自我选择的解释之后,研究者们谨慎地推断,尽管相关方法有具局限件,密度仍很可能是一个原因。因而这些结果和卡尔霍恩对动物拥挤的研究中得出的结论足相似的。 人的拥挤:在火车站的现场研究 只有操纵自变量的研究才能得出因果关系的结论。萨格特、麦金托什和书斯特(1975)把他们的被试带到曼哈顿的宾夕法尼亚火车站来测定拥挤对操作和情绪的影响。最重要的自变量是密度,通过选择在火车站的时间(上午10:00一11:30或下午5:00一6:00,处在交通拥挤的高峰时段)来操纵。这一操纵方法将时间和密度混同起来,但是实验者认为,时间对任务没有什么显著影响。结果,这一假设并未得到实验的验证。实验者仔细地统计人数来保证实际在场的人数是在期望的范围之内。 给被试一个清单,要求他们在车站内操作并完成42个任务:诸如查找电话号码,寻找售票处,在报摊买东西等等。要求他们在30分钟的期间内完成尽量多的任务;这是一个因变量。接着,被试们填写一个情绪形容词检查表(MoodAdjectiveChecklist),这是一个允许人们描述自己情绪的等级评定设计。 主要的结果是“拥挤看起来确实在一定程度上干扰了需要用知识去完成的任务和对环境的操纵”。因为被试在高密度条件下完成了大约25项任务,而在低密度条件下则完成了大约29项任务。然而在统计上这个结果只是在o.10水平上显著。这意味着它可能会偶然地在10次实验中出现一次。由萨格特及其合作者得出的结论不是特别有代表性。那些任务要求被试在车站内拥挤的人群中来回走动。即使对被试没有认知要求,也就是说,如果被试仅仅被要求尽可能多地来回走动,我们认为人群也会减慢他们的速度。在一个很拥挤的人群中走动比在一个空荡的车站中走动要难得多。因而,像作者那样把这些结果予以推广并认为在拥挤的情境中认知操作受到了影响,似乎并不合理。但是,等级量表证实了被试在拥挤的条件下感到更加焦虑和多疑。由于检查表中有11个等级,因而其中的一些表现出密度的影响也不足为奇。这种类似于霰弹枪的方法,即按惯例实施大等级的等级量表并期望其中的一些会产生重要的结果,这种方法可以导致假设的自我满足,但同时也会产生误导。尽管被试在被挤来挤去的拥挤环境中感到更焦虑是很合理的,但作者却没有解释另一个结果,即被试产生的更强的怀疑情绪。 当这项研究同埃文斯的人口统计研究相比较时,一个结论就凸显出来了。尽管控制自变量的研究一般都比仅有相关的研究更为人偏爱,但这并不必然地意味着任何实验研究都天生地优于任何的相关研究。好的研究,即使是采用相关的方法也总是比即使是采用实验方法的蹩脚研究更胜一筹。 人的拥挤:实验室研究 在这项实验室研究中,贝特森和休伊(1992)利用摄影幻灯片和录像带来模拟发生在英国伦敦一个铁路售票室的行为。幻灯片和录像带都摄自同一地点。根据出现在售票室中的人数把幻灯片和录像带分成三类来操纵密度变量。在低密度条件下,每一个售票窗口只有一个或两个人在排队。在中等密度条件下则出现的人数更多,高密度条件下就非常拥挤了。 因变量是被试接下来完成的一个问卷,它包括与认知到的拥挤、认知到的控制、愉快和路径规避有关的量表。研究者建构了一个结构模型用来解释这些因变量和如密度等自变量之间的关系。这一模型预言密度通过认知到的控制来影响拥挤,而且认知到的控制与拥挤一起决定在量表中测量的情绪和行为反应。使用了一个复杂的统计程序(LISREL)来确定结果与模型的拟合。 这一研究的特别之处在于一个附加的现场难实验,该实验是同在实验模拟时拍摄的那个售票室中购买火车票的旅客进行面谈。计算出三个不同的相关矩昨(幻灯片、录像带和现场),统计分析不能拒绝所有三个矩阵是相等的这一假设。所以实验室研究方法是有效的。经过推导,作者认为对于密度与拥挤的研究,幻灯片和录像带是非常合适的(“从生态学的观点来看是有效的”)。 拥挤研究的比较 我们已经在四项研究中考察过拥挤的影响:一项动物研究、一项相关的人口统计研究、一项现场研究和一项实验室研究。我们从每一项研究中能够得出的普遍性的种类之间存在相当大的差异。你可能会疑惑哪一项研究是最好的。对于这个问题没有简单的答案:尽管实验心理学家偏爱实验室研究,但心理学家并末对哪一种是最好的取得一致的意见。 这一部分的目的是使你知道,不管是什么类型的研究,在推广研究结果时都会遇到重重困难。到目前为止,你可能会觉得这些困难是如此之大,以至于似乎根本没有做研究的意义。然而这一结论又过于悲观。尽管从任一单独的研究来推广是相当困难的,但一组研究确实会使我们得到有代表性的结论。当研究者在设计研究想通过相关联的但不是相同的观点来研究同一问题时这一点就显得格外正确。下一部分,会聚操作将更充分地阐述这一点。 三、实验结果的信度问题 (一)个人空间圈的研究 增加科学概念的代表性和普遍性的一个好方法是进行不止一个的与该概念有关的实验。这就为这个概念提供了不止一个可供支撑的支柱,从而它不是完全依赖于任何—个单独的实验程序。我们参照这一运用多个稍微不同类型的实验来共同支持一个单一概念的技术来作为会聚操作的应用。(Garner,Hake和Friksen,1956;Garner,l974) 我们将如何以会聚操作来定义概念“成功”呢?定义一位成功人士的一个方面,至少在美国杜会是高收入。所以任何人年收人超过10万美元都可以被称为是成功的。成功的另一个特征可能是有一个可爱的家庭。成功的特征也可能包括在社区被人尊敬。上述成功的每一个特征可能都是独立的,从这个意义上说,上述的许多定义是不相关的。然而,一个成功的人很可能拥有所有这些特征。因此,这些特征集中起来可以共同定义概念“成功”。 既然你已经对会聚操作的限定有了个一般的想法,我们将用两个实验程序来对个人空间的概念进行会聚操作。这个概念意指你被一个看不见的屏障(有时称为泡)包围着,它的存在就是为了保护你的个人环境免于大量的社会侵害。在艾伊勒(1987)对700多个个人空间研究的回顾中,指出这一关于人类空间行为的概念集中在人际距离上。他认为对人类个体空间的关注源自于对动物和人类的领属范围和拥挤的研究(见本章第一部分)。环境心理学的这一活跃领域例证了对人和环境交互作用的跨学科关注。除了心理学家外,其他领域的研究者,特别是建筑师、地理学家和精神病医生,都在积极地研究个人空间概念。 我们如何知道个人空间的存在呢?由于这一假想的屏障不能被视觉、嗅觉、触觉等直接感觉到,所以这一概念必须用间接的手段来评价。我们详细讨论的这两项实验表明确实有一个个人空间环绕着我们。研究中运用了两种不同的力法来侵人个人空间。由于这两项研究的结果近似,所以我们可以说它们会聚在个人空间的概念上。 个人空间圈:一个入侵者的主动侵入 颇具讽刺的是帮助你保护隐私的个人空间圈却是以对它所捍卫的隐私的侵入来详细研究的。精神病医生金泽尔(1970)进行的一个简单实验展示了定义个人空间的一个操作。金泽尔对暴力和非暴力囚犯的个人空间因感兴趣。由于在他的研究中没有控制被试变量,而只是将囚犯区分为暴力型(对他人施加身体伤害)和非暴力型,所以更确切地说该研究的一个自变量应是被试变量。每—个囚犯站在一个长宽均为20英尺的空房间中央。然后,实验者由八个方向(第二个自变量)中的一个靠近刚D直至由于太近而使得囚犯说“停止”。因变量是当囚犯说“停止”时实验者与囚犯之间的距离。如果一个人的周围没有个人空间,那么实验者就应该能直接走到囚犯处(两者的距离为0)。控制变量是房间和实验者,整个实验中实验者都是同一个人。这一实验结果,如图14-8所示,清楚地表明暴力型囚犯的个人空间大于非暴力型囚犯的。 一个更近期的研究(Adams和Zuckermen,1992)用一个新的自变量重复了金泽尔的方法。个人空间圈是由置身于亮和弱的照明环境下的28名女大学生来确定的。结果与上图所示的非常相似,弱的照明环境下得出的结果对应于暴力型囚犯,明亮的照明环境下得出的结果对应于非暴力型囚犯。在弱的照明环境下个人空间圈较大。 金泽尔的发现已经被使用同类主动侵人程序的实验所重复(Htldreth,Derogatis和McCusker,1971;Roger和Schalekamp,1976,Womitb,1984),所以结果是可靠的。然而金泽尔的实验(以及那些重复的实验)可能仍无法使你确信的确存在一个个人空间。完全建立在一种实验技术上的概念实际上仅仅是那个特定实验结果的重复声明。而且,你可能对一个人什么也不说地径直向你走来感到有些奇怪。的确,如果这一情景在街上被你碰到,至少你会认为不正常。我们探讨的下一个实验避免了这个问题并且提供了个人空间概念的会聚操作。 个人空间图:侵入他人的空间 为了避免主动人侵某人的个人空间,贝尔富特、胡普尔和麦克莱(1972)采取了给被试入侵实验者个人空间的机会的设计。实验者坐在一个饮水处附近并假装读书。如果有人要喝水就不得不侵入实验者的个人空间。自变量是实验者和饮水处之间的距离。这一距离可以是1英尺、5英尺或10英尺。其中10英尺已经足够大到超出实验者个人空间的界限,因而是一个控制条件。一位主试的合作者记录在三种实验条件下经过饮水处的人数。因变量是路过的人中去饮水处饮水的比例。当实验者距饮水处l英尺时,只有10%的人饮水,5英尺时.有18%的人饮水。最后,当10英尺远时,有22%的人去饮水。 近期进行的研究(Ruback和Snow,1993)把饮水处实验与主动侵入范式这两方面结合起来了。在一个购物中心白人被试或黑人被试在使用一个饮水处时,被一名白人或黑人男子在距他们4英尺(远距离)或2英尺(近距离)处人侵。因变量是被试在饮水处停留的时间。图14-9显示了一个显著的种族与入侵水平的双向交互作用。如果被不同种族的人人侵,人们会在饮水处呆得更久些。因而,在被不同种族的人入侵时,饮水者表现出更大的领属范围。研究者推论说他们的材料显示了下意识的种族主义,即他们的较长停留所表现出的被动攻击。 贝尔富特及其同事报告过的结果被重复验证了(Baum,Reiss和O’Hara,1974;Thalhofer,1980),因此让被试侵人实验者的个人空间得出的结果是可靠的。更重要的是,从这一变化得出的结果与金泽尔在主动人侵情景中得到的结果一致。无论是人们的空间被入侵或他们侵人别人的空间,的确有一个缓冲带环绕着人们。个人空间因这一单独的概念可以解释上述两类实验的结果。因此,这两种类型的实验研究对个人空间圈概念的支持提供了会聚操作。 四、心理学实验中的道德问题 当涉及人类参与者时心理学家们格外关注研究的道德问题。尽管这一关注有些是由于担心研究基金的限制和不能得到被试而显出功利主义色彩,但多数心理学家是有道德的人,他们并不想给任何人施加痛苦。那种指责为了得到资料什么都做得出来的疯狂研究者很大程度上是一种荒诞的说法。 由于很难让一位实验者在判定他或她自己的研究的道德问题时做到完全公正和客观,大多数大学和研究机构都设有研究审查委员会来决定提请的研究是否道德。事实上,所有联邦资助的研究在被给予资助前都必须被这样的一个委员会批准通过。这些委员会都按照美国心理学会(1973年)提出的几条原则来指导工作。一个重要的原则是知情同意的权利。这意味着每一位可能的实验参与者都应在实验进行之前得到关于研究所有主要特征的解释并有拒绝参加研究的权利。所以,实验者有明确的义务告诉参与者实验的任何可能的伤害影响。例如,如果一项环境心理学实验需要以响的噪音来作为应激源,那么参加者事先必须被告知。这样的话,那些有着声音敏感病史(该实验可能会导致儿童时期的旧病复发)的人,就可以拒绝参加了。(即使已经得到了参加者的知情同意,有道德的研究者也不会使用任何可能导致永久性听力损伤的极强声音。) 对许多环境心理学中提出的研究来说,要完全符合知情同意的原则极其困难。在许多情境中,如果人们知道他们正在被观察,他们的举止将不会像往常一样正常。在这样的研究个案中,研究者可能会隐瞒实验正在进行的事实,而只是在研究终止后告诉参与者或简单说明一下。很显然,由于个体既没有被告知又没有同意,因而这一做法违反了知情同意的原则。这样的研究显然可以被完全禁止。然而,不少心理学家认为如此严厉的限制将大大削弱他们旨在理解真实生活环境下人类行为的研究能力,即将大大降低将研究推广的能力。他们极力主张在研究的潜在价值应该与对参与者的潜在伤害之间取得平衡。 设想你就职于一个道德审查委员会,看看你是否同意以下几例提请的研究: 1.一位环境心理学家坐在一所拥挤的图书馆内并详细记录就座的格局。 2.一位环境心理学家对一所图书馆内的就座格局进行录像。这些录像带被不限期地保留;图书馆的读者们不知道他们已被录像。 3.一位环境心理学家告诉学生们她对他们的阅读理解能力感兴趣,而事实上她却并未记录他们的阅读理解力,却记录了他们的反应速度。 4.一位社会心理学家在一家酒类商店研究旁观者介入的问题,并已经得到了商店经理的许可。在一名顾客的面前,一位实验者“偷”了一瓶酒,另一位实验者走向那名顾客并询问:“你看到他偷了那瓶酒吗?” 5.一位社会心理学家在得到男性参与者的同意之后,给他们接上皮肤电板。这些参与者被告知这些电极与在他们面前的一个测量性冲动的仪器相连。而事实上这个仪器由实验者控制。接着,给参与者放映裸体男女的幻灯片。仪器上显示这些男性参加者对男性图片给出了较高的读数,以使参与者相信他们有潜在的同性恋倾向。 衡量道德没有绝对的标准,我们不能宣称这些例子中有些绝对是合乎道德的而另一些是绝对不道德的。然而,与我们的同事们的非正式讨论的结果表明,只有第一个例子被毫不含糊地认为是道德的。由于心理学家只是观察并且不认识那些人(他们只是被资料表上的符号所表示),在这里知情同意原则被认为是没必要的。任何人,无论是不是心理学家,都可以在图书馆中很容易地观察到这些同样的人。对参与者的潜在伤害是可以忽略的。 你可能会对其他几个例子均被反对而感到吃惊。由于那些录像带没有在取得资料后被抹去,第二个例子被认为是侵犯了个人的隐私。第三个例子只有在实验者谨慎地向参与者简要说明了这一小小欺骗的真相和原因后才是可接受的。第四个例子实际上已经进行过了。一名顾客否认目睹了盗窃行为,但在她离开商店之后立即报告了警察。调查者不得不去警察局把实验者们保释出来。即使有简要的说明,第五个例子仍被认为是不道德的。即使在实验后立即澄清,然而使参与者认为他们具有潜在的同性恋倾向所造成的潜在心理伤害能否完全消除还不清楚,特别是如果参与者的确在实验前就具有被成功压抑的同性恋倾向时则更是如此。 贝尔富特和同事们使用的个人空间侵入范例(前文已经提到)已经被广泛地应用,而且是一个环境心理学家所面对的道德两难处境的最佳例子。在这种情境中,途经者是实验中不知情的被试。他们不知道有人已经有意在饮水处附近安排了一个观察者来发现哪些人饮水而哪些人不饮水。很明显,这里并未得到知情同意,而且一旦得到了的话,被试的行为极有可能会发生戏剧性的变化。从严格的实用主义观点来看,人们会作这样的争辩:即使对不知情的被试们有伤害,那份伤害也是极小的。而且,参与这项实验的人没有被摄影,也没有永久性地保留其他个人记录,所以,或许这类实验的道德不是一个太严重的问题。 然而,已进行过的此类实验研究中道德两难的问题更为突出。米德尔米斯特、诺尔斯和马待(1976)进行的一个实验引起了一些争论。他们对男洗手间的拥挤影响感兴趣。只要有可能,男人在小便时更愿意站得开一些,所以实验者在抽水马桶附近的一排(三个)便池中放一个盛拖把的水桶和一个写着“请勿使用”的牌子以控制男人们的间隔。实验时,主试的一个助手站在靠边的一个便池旁。被试与该助手之间的距离随着拖把柄和标示牌位置的改变(或是邻近助手,或是与助手间隔一个便池)而改变。这就迫使被试选择一个紧挨着抽水马桶的便池,故而助手或者与被试相邻,或者距被试一个便池远。米德尔米斯特及其同事推论说对个人空间的侵犯会产生压力;相应地,本实验中就会延迟被试小便的开始并缩短小便的过程。为了确定这些推测是否属实,一名实验者被安排坐在抽水马桶上,用一个隐藏的浴望镜来秘密观察和计量小便的开始与持续时间。 尽管窥视潜望镜的实验者不会被参加者认出,但是这看起来仍然是对个人空间圈的特别不道德的侵犯,尤其因为被试都是不知情的参与者。在一则对该实验的道德批评中,库彻(1977)指出,道德原则要求心理学家们必须保护他们的参与者的尊严,而且当尊严与隐私被威胁的时候,实验者必须谨慎衡量研究的利弊得失。库彻指出尽管这是一个公共洗手间,但使用它的人们仍希望有一定程度上的隐私。米德尔米斯特及其同事(1977)在为他们的研究辩护时提出,既然被试不知道他们正在被观察,那么他们不会感到尴尬或者被伤害。 这些例子,特别是上述便池的研究,表明往往在什么是道德的这一问题上没有明确的答案。这一责任在于实验者和审查委员会。尽管在有限的事例中欺骗和隐瞒可以找出证明其正当的理由,但在这样的实验中仍需格外小心,并且尽可能获得知情同意。 小结 实验是心理学家朝向预测和解释行为这一最终日标的前进道路上的台阶。通过进行有代表性的和能够被推广到相关情境的实验,可以最迅速地达到这个目标。代表性的两种类型是样本普遍性和变量代表性。研讨了四项对于拥挤的研究;我们能够从每一项中得到的普遍性都大不相同。 一个概念的普遍性可以通过会聚操作的使用来支持。两个集中在个人空间圈概念上的不同实验过程示范了会聚操作。心理学家格外关注研究中参与的道德问题。研究中并不总是能让参加者行使知情同意权。在这样的研究中,对参与者的潜在伤害必须与研究的可能价值取得平衡。涉及隐瞒和欺骗的实验必须在极端谨慎的条件下进行。 研究设计 问题:暴露于噪音中有害吗? 一个关系到几乎所有人的问题是噪音对人类的心理影响。机场、工厂和城市的街道使市民长期暴露在噪音环境中。我们如何评估在噪音下这样暴露的可能影响呢? 问题噪音会导致心理损害吗? 通常,从这个含糊的问题可以引申出几个假设。首先:我们提出一个能在高度控制的环境下被检验的假设来尝试一下实验室方法。假设处于强的(110分贝声压级)持续的白噪音中,将会使人在25分钟内所能解出的数学题的数量减少、精确度下降。 我们如何得出假设中指定的一些变量呢?自变量噪音强度(设定在110分贝,和一台铆接机的强度一样)接近于暴露在25分钟的噪音下的安全界限。任何再强一些的噪音都有可能对人造成伤害,而强度再小一些的噪音或许不会产生实验效果;也就是说,如果比110分贝弱得多的噪音对行为没有影响,我们倾向于得出这样的结论:我们的噪音不够强。白噪音(大致类似于当你将收音机调到台与台之间时所听到的声音)包括所有频率的声音,是实验室中常用的一种很方便的噪音源。 为什么要在噪音中暴露25分钟呢?由于我们希望用大学生作被试,我们知道如果实验接近1个小时——即和一节课的时间几乎一样,他们便会认为最合适。因为我们的假设暗含了一个无噪音的控制条件,我们将1个小时的实验分成两个25分钟的部分,一个有噪音,一个没有噪音。这就为指导语和询问任务完成情况留下了10分钟。 我们的因变量是完成一项数学任务的成绩。选择这项任务是因为它是大学生熟悉的一个简单任务,实验时不需要再做训练。成绩是回答正确和错误的问题数目,这些都很容易测出。因为练习或疲劳或许会有影响,我们将仔细平衡我们的实验:使一半参加者在安静的条件下开始,另一半在噪音条件下开始。由于所有的被试都要完成所有的条件,因此这是一个被试内实验设计,比被试间实验设计提供了更高的精确性。在被试内实验设计中,每个人都与他或她自己相比较。这样个体之间的差异不会增加实验误差。但是,如果我们担心在噪音条件后的行为表现和安静条件后的行为表现会有差别,即当噪音不再呈现时它仍然在耳边回响,那么一个更好的实验设计就是被试间设计。将参加者分组,每个25分钟的实验用单独的组来进行。 尽管我们的实验控制得很好,但当我们试图推广实验结果时仍存在几个问题。如果没有得到噪音影响的效果(噪音组和安静组的数学成绩一样),将会有这样的争论,一个25分钟的样本的确是太短了,以至于我们不能从中了解到一个多年每日8小时处于110分贝噪音中的工人情况。另一方面,如果得到了噪音影响的效果(即噪音组的数学成绩更差),仍然会有争论:工人最终已适应了噪音环境,如果我们持续测验参加者几天或几个星期,我们最初的效果就应消失。现在我们提出另一个假设,这样实验结果更易于被推广。 假设 一个嘈杂的城市街道上的居民们将会:(a)更频繁地搬家;(b)与安静的街道上的居民相比,他们会在一个居住满意情况的等级量表中给出低分。 由于这个假设是关于永久居民的长期影响的,因此避免了前一项实验中存在的推广问题。然而,这个假设不像其他假设那样明确。事先并没有指明嘈杂街道和安静街道的噪音水平,而这些在实验中是要被测量的。实验者还必须决定是只测量特定时段的声音水平,如交通拥挤的高峰期,还是取24小时的平均值。这个准自变量没有完全处在实验者的控制之下。而且,它或许还和收入、地位等因素混淆起来,因为社会经济地位较低的人更有可能居住在嘈杂一些的街道上。 因变量也不完全令人满意。即使居民常想从咽杂的街道撤走,但经济因素可能会阻止他们这样做。另一方面,一个地区的人员更新率是一个能被可靠测量的客观数字。第二个因变量在很大程度上依赖用于评价居住满意情况的等级量表的效度。主试将试图找到一个已在几项研究中使用过的且已被证明有效的量表。如果主试要被迫编制一个量表,那么这个量表首先必须被证明是有效的——这是一个既费时又困难的过程。因而,这项研究更容易推广的代价就是实验者控制的相当大的损失。 当我们将这两项研究作为对这部分最初所提出问题的解答并予以比较时,非常清楚,两者都不完美。研究工作中经常是这样的,没有一个单一的实验能回答一个问题。科学家被迫将注意集中在一个更具体的假设上,这样就只回答问题的一部分。对所有的心理学家来说,这是挫折的一个主要根源,因为只有当很多细小的对应于每个具体假设的部分被拼拢起来之后,才能得出一个全面的回答。一个环境心理学家可能会穷其一生来努力认识噪音和它的心理影响。 噪音污染对健康有害的证据不只在实验和环境心理学中。例如,建筑师现在已认识到他们的设计必须能够消音(Bunzaftt,1993)。当在建筑学的期刊上发现对心理学研究的引用时,我们可以确信环境心理学的主张——环境特征深深地影响人类的行为和健康——正被日渐接受。