《对“伪心理学”说不》
Day 1
№1 导读
当听到我的专业是心理学时,不少人会说“你知道我心里在想什么吗”。我往往会吐吐舌头告诉对方“当然知道啦,不过初入师门时我就发过毒誓,绝不向外行人泄露天机”。但愿你能够听出我的回答只是个玩笑。一提到心理学,人们常常会首先想到“占卜”、“解梦”、“催眠”等充满魔幻色彩的字眼。可是心理学没有那么玄妙,无法一眼看透别人的内心世界,更无法通晓过去、预知未来。
这种对心理学的误读曲解或盲目崇拜是有原因的。每个人都渴望了解自己、了解自己身边的人,人们往往出于好奇、或是抱着“求医问药”的心态来关注心理学。真正的科学心理学如同物理化学一样,有其独特的术语体系,一时半会难以弄懂,这恰恰为通俗心理学提供了生存的空间。一时间,市面上各种伪心理学的产物百果充斥,血型、星座、色彩通通挂上了心理学的招牌。再加上媒体为赚眼球大肆地错误引导,专注于基础研究的学院派心理学家显然敌不过擅长“灌鸡汤”、“打鸡血”的江湖术士们。
那么真正的心理学是什么?心理学主要就是心理咨询吗?“神经症”“压抑”“潜意识”算不算心理学?不可否认,弗洛伊德的精神分析学派对后世的研究者产生了重大的影响,他提出的无意识论至今还被哲学、心理学、历史学、艺术学、文学、法学广泛沿用,并且在临床心理学上具有深远的实践意义。但是,精神分析只是临床心理学的一种流派,而临床心理学(包括心理咨询、心理治疗等)也只是心理学的一个分支而已。弗洛伊德这位伟人令当今的心理学者们“又爱又恨”的地方就在于,他的理论无法用实证的方法来验证。而实证方法正是科学心理学的标志。实证方法的出现,让我们开始用研究、证据和知识来取代直觉、经验和常识,从而使心理学成为一门真正的科学。
加拿大心理学家Keith E. Stanovich的这本《对“伪心理学”说不》是一本质量极高的科学心理学科普读物。我们的学习过程是参照窦东徽、刘肖岑两位老师(亦是一对学术伉俪)的译本展开的。这本书教给我们掌握科学的、实用的批判性思维技能,像心理学家一样去思考。证伪的科学本质与概率推论的思维习惯将会是本书、也是科学心理学甚至是所有社会科学始终强调的核心内容。如果你准备好了,就让我们踏上“对伪心理学说不”的旅程吧!
№2 科学的心理学(一)
科学的心理学究竟是什么?它又有怎样的什么样的特性,使得它可以与 所谓的“伪心理学”区分开来呢?相信读了今天的内容,你会对科学的心理学有一个更加深刻客观的认识。
如果让你说出一位心理学家的名字,你首先会想到谁?若暂时不考虑常常出现在大众传媒中的伪心理学者和“鸡汤心理学”畅销书作者们的话,毫无疑问,得票数最多的心理学家当属西格蒙德•弗洛伊德(Sigmund Freud)。他的专著《梦的解析》你或许略有耳闻,他提出的“潜意识”概念你肯定在文学或影视作品中见到过。有人说,马克思、爱因斯坦和弗洛伊德是改变了世界的三个犹太人,这句话并不是空穴来风。
然而,国际心理学界最权威的两个团体——APA(美国心理学会, American Psychological Association)和APS(美国心理科学协会, Association for Psychological Science)的会员中,认同弗洛伊德和他的精神分析理论的学者竟然还不足十分之一。对于现代科学心理学来说,弗洛伊德的作用的确是被无限地夸大了。这种夸大带来的后果就是,人们误认为心理学的研究方法就是精神分析学派的个案研究和内省方法,而这些方法恰恰是现代科学心理学所排斥的。科学心理学出现之后,开始主张用科学方法理解行为,采取控制实验等量化研究范式,使研究发现可靠、可验证、可重复,从而使心理学真正加入了科学的阵营。
1879年,威廉•冯特(Wilhelm Wundt)在德国莱比锡大学建立了世界上第一个心理学实验室,标志着科学心理学的诞生。科学心理学是哲学和实验生理学之子,它传承了哲学的研究问题,同时借助了生理学的实验方法。经过一百余年的发展,现代心理学远远超越了哲学心理学时期的研究内容,横跨了社会科学和生物科学两大领域,成为了包含发展与教育心理学、工业与组织心理学、人格心理学、社会心理学、生理心理学、临床心理学、军事心理学、进化心理学、犯罪心理学等诸多分支的学术王国。美国心理协会(APA)设有53个分支机构,分别代表了不同的心理学研究或应用领域,由此也可以看出现代心理学的多样性和广泛性。
№3 科学的心理学(二)
庞大的心理学学术王国也存在着尴尬和困境,各个领域之间分化严重,依据目前的认识经验还难以整合。就如同20世纪早期的物理学,在借助抽象的数学理论整合为现代物理之前,被割裂成了力学、热学、光学、声学、电学等众多分支。不难想象,在一所大学之中,心理系的教师是可以很容易地分派到其他各个院系进行学术交流的,教育心理学家去教育学系,生理心理学家去生物学系,社会心理学家去社会学系,工业与组织心理学家去商学院或管理系……
或许你会疑惑,既然心理学诸多分支在内容上、领域上难以整合,心理学为何还能够成为一个统一体?心理学还有作为一门完整的科学存在的必要吗?我们应当承认,目前心理学无法达成所有领域的高度统一(事实上,要求任意学科的所有领域具备高度统一性都是不合逻辑的),但是,不同心理学领域存在的共性就是研究方法上的统一性,这也是将繁多的心理学分支联合在一起的关键。心理学作为一门独立的科学,采用数据为基础的科学方法来探究人类和动物的行为,其实际应用也必须具备科学的依据和基础。我们有理由坚信,现代心理学是一门将人类固有信念置于科学检验之下的真正的科学。
那么,什么是科学?一般认为,科学具有三个重要特征。
第一,科学基于系统的实证主义。长久以来,人们获取知识的办法是纯粹思考或诉诸权威,科学的出现为人类认识世界开辟了实证的途径。实证是一种基于观察的实践,通过反复验证找寻世界的规律,与思辨的方法有着本质的不同。中世纪的天主教会坚持“地心说”的观点,认为神在宇宙中心安置地球供人类居住,这是从教会信仰出发的思辨式的解释;而哥白尼通过长期的天文观测提出了“日心说”,就是一种实证取向的做法。单一的实证主义当然还不够,科学必须是系统性的、结构化的实证取向,它由理论驱动、靠理论连接,依据观察结果验证对问题的解释观点。
第二,科学具备公共性的、可检验的知识。一个新的发现首先会产生于某个研究者的头脑中,此时的状态还算不上是科学。这一发现必须被研究者公开提出,并接受其他人的批评和验证,成为公共知识之后,才能成为科学。公共提出并进行检验,保证了知识不是由于提出者的错误或者是偶然的随机偏差发现的,在这一点上足以看到科学心理学与伪心理学的不同。伪心理学阵营的江湖术士们往往选择避开学术出版渠道,直接通过媒体哗众取宠,宣扬自己的发现;而心理学科学家则是在科学期刊上发表研究发现,并接受同行评审和验证。
№4 科学的心理学(三)
第三,科学具备实证的、可解决的问题。提出问题是科学研究的起点,真正的科学问题必须是明确、具体、可解的。如果提出的问题依靠现有的经验和技术水平是肯定无解的,或者本身就不可能被验证,就不能成为一个科学问题。“我是谁”是一个终极的哲学问题,但这不是一个实证的问题,就不属于科学领域。我们若将问题不断地具体化和操作化,提出一个新的科学问题——“不同的父母教养方式是否影响青少年的自立人格”,就实现了从“无解”到“可解”。让问题“落地”,才使得心理学脱离哲学,成为了一门独立的科学。
实际上,我们每个人都有一套自己固有的行为模式。这套模式支配着我们的思维、情绪、动机以及人际互动的种种过程。我们常常会用一些世俗智慧来解释自己做出的行为,并认为这些常识是老祖宗们代代相传的处世法宝。认识科学心理学,也许能帮助我们驳倒这些“常识”的误区。
其一,世俗观念的解释常常是自相矛盾的,难以形成结构化的系统。比如我们说“好马不吃回头草”,可为何又说“浪子回头金不换”?我们说“兔子不吃窝边草”,可为何又说“近水楼台先得月”?
其二,“常识”的解释都是不可证伪的。这些看似毋庸置疑的道理,其实在提出时就没有给我们留出反驳的机会。我们无法说“不可反驳”就一定是错误,但是“可证伪性”才是科学真谛的前提条件(“可证伪性”将在下张卡片专门介绍)。经过科学的研究和验证,昨天的“常识”很可能就变成今天的谬误;而今天的常识,即将在明天与科学心理学展开一场激动人心的碰撞。
作为一门年轻的科学,心理学的确饱受争议和误解。有人否认心理学有用,竭力反对将心理学视为科学;也有人害怕心理学被用,担心心理规律的探明会导致人类的灾难。不过无论如何,心理学已经在科学的百花园里站稳了脚跟,正在渐渐绽放它独有的芳菲。
№5 可证伪性原则(一)
我最近状态不佳,隔壁的王大妈苦口婆心地劝我去拜拜菩萨。“庙里的菩萨可灵啦!你看看楼上的小李,拜完菩萨之后生意一直顺风顺水的。”“可是楼下的小张前几天也去拜了菩萨啊,怎么刚回来就摔骨折了呢?”“心诚则灵啊,那是小张心不诚。”
王大妈的理论听上去确实是无可辩驳。她坚信自己的观点是正确的,但却没有有效的方法对“拜菩萨”的效果进行系统的验证。在前一章中我们提到过,科学的第三个基本特征是“可解的问题”。要让问题可解,就必须可以去检验,即可证伪。如果人们在拜完菩萨之后心愿达成,就归功于“拜菩萨”这一方法,算是对其有效性的肯定。公平地讲,若是人们在拜完菩萨之后未能出现好的结果,那就应该是对“拜菩萨”的效果的否定,这样才算合理。可是王大妈的理论却将坏的结果归因为“心不诚”,实质上是合理化了‘拜菩萨’出现的否定效果,这显然违反了可证伪的原则。
可证伪性标准最早是由著名的科学哲学家卡尔•波普尔(Karl Popper)在《猜想与反驳》一书中提出。该标准主张,一个合理的理论必须要预测明确、两面兼顾。也就是说,科学理论必须要阐明将会出现的结果以及不会出现的结果。如果不会出现的结果确实发生了,就证明这个理论有问题,需要被修正或者推翻。可是,如果一个理论对任何未知的结果都能够自圆其说,那就值得我们怀疑了。这样的理论将永远不会被修正或推翻,它把人们永远地限制在思维的牢笼中,得不到任何进步。
在这里我们还要区分一下理论和假设。理论是一组能够对未知结果做出解释和预测的、具有内在联系的概念;假设则是理论的具体化和操作化,是可以直接被观察数据所验证的猜想。当提出的假设没有被实践所证实,而是与观察结果相矛盾时,我们就要对现有的理论进行修正,甚至是重新构建一个理论去解释事实。在这样的循环往复中,我们的科学体系就被建立了。所以我们目前的科学讨论,并不是直觉与猜想,而是已被证实或是未被证伪(并非不可证伪)的理论。
№6 可证伪性原则(二)
一个假设做出的预测越精细,它被证伪的可能性就越大。如果我预测“下一辆驶过我们面前的汽车尾号一定是5”,那么我预测成功的可能性就比较小。若在这种精细的预测下,下一辆驶来的汽车尾号真的是5,你一定会觉得我的预测理论很神奇,也很有说服力。可是,如果我预测“下一辆驶过我们面前的汽车尾号一定不是5”,那么即使我预测成功了,你也会觉得这没什么大不了的,因为我的预测太过笼统。
好的理论总是会将自己可被证伪的一面展示出来,而坏的理论却从不肯将自己置于危险的境地。许多人都相信星座性格分析,常常感叹“这个描述简直和我一模一样”。但是你有没有发现,星座对人格的描述都是笼统的、一般性的。若是遮住星座类型只看下面对应的描述,你会发现几乎每一种星座的特点都有你的影子,例如“你是一个善良的人但偶尔也会发点脾气”、“你渴望交朋友但是也希望有独处的空间”,这些“放之四海而皆准”的描述的确容易令人接受,但它并不能反映出你的人格本质(在心理学中被称为“巴纳姆效应”)。
科学总是在犯错中逼近真理,不允许自己的理论被证伪才是人类最大的危险。弗洛伊德的理论提供了对人类行为的解释观点,但这种解释都是事后的,难以发挥预测作用,亦无法让我们去证伪,这也是后世的心理学家们对精神分析学派逐渐丧失认同的原因所在。可证伪的标尺让现代心理学脱离哲学,成为了一门独立的科学。但不可否认的是,心理学中依然存在着许多不可证伪的理论,这或许正是心理学作为一门处于自然和社会的边界、研究人类主观世界的学科的特色。受到方法论的制约,世界上大部分现象还是科学无法解释的。不可证伪的理论不在科学的解释框架之中,也不在本书的讨论范畴之中,这似乎是一个更为深刻的哲学问题。
思考与讨论:
阅读完今天的内容后,你明白“科学心理学”究竟是什么了吗?请举出它的三个特性,并回想一下你所熟知的心理学知识,是否都符合这些特点呢?
“可证伪性”是科学命题的真谛,只有将命题置于检验之下才能让我们发现问题,并不断完善。回想一下,你这几天是否对某件事下了结论?它可以证伪吗?如果可以,需要如何证伪?
Day 2
№7 操作主义与本质主义(一)
今日导读
昨天,我们了解了科学的心理学得以与“伪心理学”区分的特质。从今天开始,我们将对其中的一些概念进行更深入的学习。在心理学问题上,概念和应用哪个更重要?在理解世界时,个案有什么作用?现在,就让我们带着这些问题一起阅读接下来的内容吧。
情绪是心理学研究的一个方面。可是,什么是情绪?“情绪”这个词的真正含义是什么?换句话说,这个概念或者术语的内在本质又是什么?这种刨根问底、直击本质的做法固然是精神可嘉,然而这似乎并不是科学心理学家们真正关心的问题。
哲学家波普尔把这种对待科学的观点或行为称为“本质主义”。本质主义者认为能够反映事物内在本质或本质属性的终极问题才是好的科学理论,他们喜欢对某个单独的概念咬文嚼字。所以他们一味地去追求绝对的、完美的、最终的答案,殊不知科学体系本身就是没有终极答案、不断证伪、不断自我否定的螺旋前进的过程。科学知识的价值和魅力在于提供了一种消除错误的方式,正因如此,自称绝对完美的做法其实阻碍了人们未来的探索。一位真正的科学家绝不会宣称自己的理论是完美的,而是永远保持着开放、自由的态度。
情绪是我们对综合了多种心理和生理状态的一系列主观认知经验的统称。不过,“情绪”这个词本身只是一个代号而已,因此本质主义者对一个概念本身的强调往往是没有意义的。科学心理学家们更关注概念之间的联结,致力于研究概念与概念的相互关系,比如“如何运用认知方法改善消极情绪”。概念的意义不在于反复推敲术语的措辞,而在于研究清楚它的作用,这才是科学心理学家们的真正任务。
相对于本质主义而言,我们所提倡的操作主义则是更为务实的。不借助实证研究的理论探讨就像是空中楼阁,而操作化就是让高高在上的理论“落地”的过程。所以,在进行一项研究之前,心理学家首先要做的就是给概念下操作性定义,即用可观测的事件来表示概念。假如我们要研究观看暴力视频对儿童攻击行为的影响,我们绝不可以将攻击行为定义为“个体对另一个体的失控的敌意”,因为敌意是一个我们无法观测的内在状态,我们无法把这个概念或定义直接代入研究。如果我们将这个研究中的攻击行为定义为“观看在实验室中攻击别人的3分钟短片后,5分钟内,儿童可能按动按钮给隔壁房间的儿童施加疼痛刺激”的话,那我们就可以在实验中进行观测,以得到支持或证伪我们假设的研究证据。
№8 操作主义与本质主义(二)
操作性定义有直接和间接之分,它反映了某一概念与观测它的操作之间的联系程度。由于心理学研究范畴中的概念大多是存在于人的主观世界中的,所以绝大多数的概念都是采用间接的操作性定义。
智力一直以来都是是心理学研究的热门话题,可是“智力本身是什么”我们的确很难说清楚。有人把智力称作“适应环境的能力”或“一般性的精神能力”,这些解释都不是心理学家关心的。心理学家对智力的操作性定义看起来有些简单粗暴,仅仅是“智力量表测得的分数”。就是这样一个直白的定义,才得以使不同的研究和研究者能够通用“智力”这一概念,从而使有关“智力”的科学知识和理论在假设和验证的循环中不断丰富。
“智力量表测得的分数”并不像说的这样简单。
智力这个概念包含了一系列的二级概念。按照哈佛大学发展心理学家霍华德•加德纳(Howard Gardner)的多元智力的观点来看,智力至少包括语言、数理逻辑、空间、身体运动、音乐、人际、内省、自然探索和存在九个维度。每一个二级概念本身也需要操作性定义,整个智力的概念其实是各个二级概念的复合体。
而且,不同的理论对智力成分的观点是不同的。除了多元智力理论之外,被广泛认可的还有斯皮尔曼(C. Spearman)的二因素说(G因素和S因素)、罗伯特•斯腾伯格(Robert Sternberg)的三因素说(成分智力、经验智力和情境智力),等等。而国际通用的“韦克斯勒智力量表”则是从言语智商和操作智商两个维度,对智力的12个方面进行系统的测量。也许你会疑问,既然有那么多智力的测量方法,那么智力测量得分的标准不就不统一了吗?
确实,每一种智力测验都会有其具体的换算方法和对照常模。没有任何一种测量工具能够完美地反映概念,尤其是心理学概念的本质,幻想只使用一种绝对精密的工具来测度某一概念的做法,正如同本质主义对概念的咬文嚼字一样毫无意义。科学研究首先要做的就是将概念操作化,能够使其他的研究者按照同样的操作定义进行重复研究,这才是让科学知识变得公开、可检验的机制。
№9 操作主义与本质主义(三)
操作性定义当然不是拍拍脑门就能决定的,一个好的操作性定义必须具备高的信度和效度。
“信度”是指测量结果的一致性、稳定性和可靠性,即用同一种测量工具对同一概念进行多次测评的结果的一致性程度。比如,用一架电子台秤去测量某个物品的重量,反复测量多次的读数都是一样的(重测信度),或不同的人去实施测量过程得到的读数总是一样的(评分者信度),这就表明这架电子台秤的信度很好。
信度仅仅是代表多次测量的一致性,但并不表示测量一定是成功的、有效的,我们还需要用“效度”来表示测量工具或手段能够准确测出所需测量的事物的程度。所以,信度高只是效度高的前提,是一个必要条件而不是充分条件。假如,我们用那架电子台秤去测量身高,即使是多次测量的读数一致性很高(信度高),我们也不能用得到的结果去表示身高,因为这个操作并不是对概念的有效反映。高信度并不意味着高效度,而高效度一定要先保证高信度。要想把心理学概念用有效并且可观测的工具操作化,恐怕也绝非易事。心理学研究者们就是在不断地努力完善概念的操作性定义,通过搭建这些工具来使理论越来越真切地反映内心世界的全貌。
№10个案研究与见证证据(一)
近代最有名的发展心理学家让•皮亚杰(Jean Piaget)算得上是一个奇才。皮亚杰生活的时代正值行为主义学派和精神分析学派支配整个心理学界,他却不为两大主流倾向所影响,在夹缝之中提出了“发生认识论”,创立了日内瓦学派。日内瓦学派关于人类认知活动的研究成果不仅是对心理学,而且对于认识论、逻辑学、语言学和教育学等学科都产生了巨大影响。皮亚杰本人也被誉为20世纪最伟大的学者之一。而在这里我们要提到的,是皮亚杰最初使用的研究方法——个案研究。
皮亚杰的儿童认知发展理论受启发于对自己孩子的长期观察、访谈和实验。他的个案研究方法,就如同解剖麻雀一样,对某一个单独的个体进行深入、详尽的考察。不可否认,皮亚杰关于儿童思维的理论猜想大部分已经被证实,个案研究确实是为开启心理学研究的新领域提供了灵感。然而,我们必须要知道的是,个案并没能够证实皮亚杰的理论,个案研究仅仅能够提出一种可能性。
在科学研究的早期阶段,由个案研究带来的灵感或许能够开启一扇新的大门。但是,科学发展到理论检验阶段之后,由于个案研究和见证证据都是孤立存在的事件,有着太多的偶然性和不确定性,也遗漏了太多其他有可能的解释,所以并不能作为证实或证伪的依据。
我们可以通过“安慰剂效应”来更好地理解这一点。你或许听过这样一个故事:一个总爱低着头的小女孩,总觉得自己长得不够漂亮。有一天她在饰品店买了一只绿色蝴蝶结,店主不断赞美她戴上蝴蝶结之后的美丽。小女孩不由昂起了头,急于让大家看看,出门与人撞了一下都没有在意。她走在街上遇到的每一个熟人都热情地与她打招呼,她的朋友夸她昂起头来很漂亮,就连陌生人都似乎在对她点头微笑,她想一定是这蝴蝶结的功劳。可她回到家一照镜子,才发现头上根本就没有蝴蝶结——原来是出饰品店时蝴蝶结早被撞掉了。看来,真正发挥作用的并不是蝴蝶结,而是根本就不存在的“安慰剂”。“安慰剂效应”最早是在医药研究领域被提出的,研究者发现即使病人得到了无效的治疗,但却由于“预料”或“相信”治疗有效,而让病患症状得到了舒缓。
№11 个案研究与见证证据(二)
通过了解“安慰剂效应”,我们就能够知道神婆们对病痛的治疗为什么看上去似乎有效了。在神婆的忽悠之下,求医者受到了强烈的暗示,相信自己的病症被治好了,精神和心情也随之好转,病痛也得以缓解。庸医能够大行其道,多数也是凭借一些由于“安慰剂效应”而对治疗效果深信不疑的个案,以及这些患者们口口相传的见证叙述。
除了安慰剂效应,“鲜活性”的问题也可以说明来自见证的证据并不具有说服力。我身边有不少人惧怕乘坐飞机,他们总觉得近年来坠机事故频发,还不如乘汽车安全稳妥。但是如果用科学理性的思维来判断的话,飞机还真算得上是目前地球上最安全的出行方式。事实上,在美国过去的60年里,飞机失事所造成的死亡人数,比在有代表性的3个月里汽车事故所造成的死亡人数还要少。即便是一个人天天坐飞机,也要一万四千年才有可能遇上一个航空事故。那么为什么会有人觉得飞机不如汽车安全呢?这是因为飞机事故造成的社会影响比其他事故更大,事故虽然少但严重程度高,受关注度也更大。由于飞机事故是一个更具有“鲜活性”的见证,才误导了个人的判断。
与此类似的,许多个案被包装成生动鲜活引人入胜的故事,在媒体的推波助澜下,掩盖了科学数据的事实,混淆了公众的视听,这正是伪科学惯用的伎俩。人是一种非理性决策的动物,依赖个案和见证的证据也算是人之常情。不过,要想科学理性地判断一个理论正确与否,还需要在后面的章节中了解我们真正所需的证据。
思考与讨论:
通过今天的阅读,你理解什么是操作性定义了吗?你所学的学科中或通过生活获得的知识中有没有采用操作性定义的概念呢?请举例。
只要细心观察,似乎不难发现生活中的种种“安慰剂效应”。那么,你怎么看待“安慰剂效应”?你认为它对我们的生活有帮助吗?
关于某地区的刻板印象,媒体对个案夸张的报道等充斥着我们的生活,这些都是“鲜活性”问题的具体体现。你也有类似的体验吗?请与大家分享,并思考,今后该如何避免这样的认知偏差呢?
Day 3
№12 相关和因果(一)
今日导读
昨天我们学习了心理学研究中常采用的定义方式,并知道了个案研究可能带来偏见,那么我们到底该如何设计一个合理的心理学实验并从中推出合理的结论呢?相信读完今天的内容,你会有所收获。
我们已经知道,科学心理学从来不以见证或个案来作为研究的证据。那么,按照操作主义的观点,我们在对一个理论的真伪进行验证的时候,就必须用变量来取代概念,用研究假设来取代逻辑关系。而对变量关系作出的最普遍的研究假设就是“相关”。相关就是相随变动的关系,在我们的生活中十分常见,比如学业自我效能感与学业成就之间的正相关、抑郁与心理健康之间的负相关,等等。但需要注意的是,相关仅仅是相关,统计学上的相关并不意味着有实际意义,在作出推论时更要慎之又慎。
某沿海地区开展了一次大规模调研,目的是考察溺水事故的可能原因。其中有一个研究团队的调查结果很有意思。他们经过大量的数据收集和统计分析发现,该地区的溺水死亡人数和冰激淋的销售量呈现出强烈的正相关。难道说,是因为冰激淋食用过多造成了溺水事故?恐怕当地主管部门也不会因此而制定政策限制冰激淋的销售,这显然是一个荒唐的治理方案。
从这个例子中我们也可以看出,溺水死亡人数和冰激淋的销售量这两个变量之间的确存在着统计学上的相关关系,但绝不会是因果关系。或许我们可以猜测,溺亡人数和冰激淋销售量之间存在着“虚假相关”,即这两个变量是通过了“第三方”的变量联系起来。这个“第三方”可能会是季节或是气温:夏天来临,气温升高,冰激淋的销售量会增加;同时天气较热时会有更多人去海边戏水解暑,夏天正是溺水事故多发的季节。看来,这才可能是溺亡人数和冰激淋销售量相关关系的内部机制。所以,无论二者的相关关系有多强烈,我们都不能说它们之间存在因果关系。
人类是非理性的动物,常常把相关关系误认为因果关系。而且并不是所有的漏洞都像上面的例子一样显而易见。我们接下来将围绕第三变量问题、方向性问题和选择性偏见进行讨论,以帮助你在作出因果推论时更好地识破相关证据的局限性。
№13 相关和因果(二)
上个世纪20年代,哈佛大学的心理学家在美国西方电气公司下属的霍桑工厂,进行了一系列著名的心理学实验。其中,在一项照明实验中,研究人员假设,提高照明度能够提升工人们的生产效率。研究者们选取了一个车间的工人作为研究对象,给予这个车间高强度的照明。结果发现,该车间的工人们在实验期间的生产效率的确有大幅度的提高。于是理所当然地作出了“提高照明度能够提升工人生产效率”的因果推论。
后续的研究者带着对这一结果的质疑重新设计了实验,这次他们选取了两个车间的工人作为研究对象,给予其中一个车间高强度的照明,而给予另一个车间低强度的照明。结果发现,两个车间的工人在实验期间的生产效率都有大幅的提高。原来,工人们生产效率的提升并不是因为照明度的改变,而是因为他们意识到自己正在被别人观察,所以更加努力地表现自己。这个例子就揭示了“第三变量问题”,在第一次的研究中,研究者未能很好地操纵、控制和测量“感知到的被观察”这个第三变量,所以作出了错误的因果推论。
可是,有些问卷法的研究并不能直接地操纵关键变量,所以心理学家们创造了许多复杂的统计方法(偏相关、多元回归、路径分析等)来排除其他无关变量的干扰。从这个角度上来说,心理学家们也为统计学的发展作出了巨大贡献。
当代著名的心理学家阿尔伯特•班杜拉(Albert Bandura)最大的贡献之一,是他所提出的“自我效能感理论”。“自我效能感”是指个体对自己是否有能力完成某一行为所进行的推测与判断。教育心理学领域曾存在这样一种观点,高水平的自我效能感能够带来学业成就。这一假设得到了许多研究结果的支持,也为许多旨在提高自尊自信的教育政策提供了理论依据。然而,二者的方向性是确定的吗?有人提出,自我效能感和学业成就之间也有可能是一种相反的作用方向,即成绩越好的学生更会对自己完成事情的能力充满信心。目前的研究也的确证明了这一点,自我效能和学业成绩之间并不是简单的因果关系,更有可能是一种互为因果的复杂机制。
№14 相关和因果(三)
再来看一个二战期间的故事。有一位飞机维修师,通过分析战机上子弹孔的分布来为飞机改造提供建议。按照常理来说,被子弹击穿的地方,应该安装上防弹层,以保证飞机不被损坏。但如果你这样决策的话,就陷入了“选择性偏差”的圈套。因为,子弹袭击飞机各部位的可能性几乎是相等的,如果飞机能够返航接受修理,那么被击穿的部位肯定不会对飞机造成致命的伤害,而返航机上没有弹孔的地方,正是那些坠毁战机被击中的要害!如果维修师犯了“选择性偏差”的错误,那么造成的后果将会是触目惊心的。
以上三个局限性告诉我们,从相关到因果,必须要在操纵所有变量的前提下进行严密的实验。
显然,有相关不意味着有因果,相关关系只是因果关系存在的前提。但这并不是说相关关系的证据就没有价值。当我们的目标是预测而不是发现原因时,我们仅仅用到相关就足够了。随着大数据时代的来临,我们利用海量数据的相关分析,通过找到现象的关联物就足以预测未来。就如同《大数据时代》的作者维克托•迈尔-舍恩伯格(Viktor Mayer-Schönberger)所说,对于许多事情,知道“是什么”就够了,没必要知道“为什么”。
№15 操纵和控制(一)
在相关研究中,我们只需要通过观察两个变量之间是否存在相随变动的联系就可以得出结论。因果研究的证据则更多地需要来自真实验的方法(问卷法也可以通过交叉滞后检验等统计学办法得出因果推论,暂不作详细介绍)。
根据实验的控制程度,我们可以将实验方法分为前实验、准实验和真实验三种类型。
前实验
前实验设计又称为非实验设计,只是进行简单的观察和比较,不主动地去操纵实验条件,更缺乏对无关干扰因素的控制,所以无法得出因果推论。假若我们想要探究学生的受教育水平对其攻击行为的影响,这里涉及到两个变量,受教育水平和攻击行为。受教育水平作为诱因,被称为自变量;攻击行为随着自变量的变化而变化,称为因变量。有一种简单的做法是,可以在学校的每个年级各选取一部分孩子作为观察对象(代表了不同的受教育程度),分别记录他们表现出来的攻击行为,并比较各个年级之间的差异。然而这个结果是无法作出因果推论的。在这个研究过程中,我们无法主动地操纵自变量,因为每个学生所在的年级都是在研究之前就固定了的。我们也没能很好地控制其他有可能影响攻击行为的无关因素,比如孩子的年龄、成熟程度等因素。所以说,前实验设计更像是一种在自然情境下的观察。
准实验
相比较于前实验设计,准实验设计的控制程度有所提高。比如在上一章节中提到的霍桑工厂实验,我们通过给予两个车间不同照明条件的处理方式,进行了分组和自变量操纵。低照明车间作为控制组的出现,使研究者获得了“比较信息”。若是没有控制组,我们就更有可能将工人生产效率的提高归因于照明条件的改善而非“被关注”,控制组的设计则帮助研究者很好地避免了错误的推论。但是,准实验设计也无法完全控制误差来源。在这个案例中,我们直接用两个划分好的车间作为给予不同实验条件的研究组,没有能够对被研究的对象进行随机分组。所以,就算是研究结果显示高照明度车间工人的工作效率高于低照明度车间工人,我们也不能轻易作出“照明度影响工作效率”的因果推论。这是因为,两组工人工作效率差异的出现,有可能是两个车间的工人本身就存在差异,这种差异并不是我们操纵自变量带来的,而是分组之前就客观存在的。
№16 操纵和控制(二)
相对于前实验和准实验的实验方法,真实验方法可以为因果关系的证明提供证据,因为它对研究过程的要求最高。
真实验
被试(实验对象)的随机分配和自变量的直接操纵必须同时满足,才算得上是一个真实验设计。同样通过一个例子来加以说明:假设需要研究喝咖啡对人们集中注意力的影响,我们可以招募20名大学生志愿者参与实验,并把这些被试随机分配到两个组。随机分组并不是随意分组,而是根据统计推论的原理,使每个实验对象分配到不同实验处理组的机会相同。随机分组能够避免实验者主观因素的参与,并且尽可能地控制意想不到的无关因素带来的实验误差。
接下来是对自变量的操纵,让实验组的被试喝200毫升的咖啡,对照组的被试喝等量的纯净水。直接操纵自变量能让我们产生更具有说服力的推论,实验组和对照组除了被操纵的自变量之外其他变量均保持不变,为我们排除了因变量受其他无关因素影响的可能性。
在自然情境下,不同的事物之间互相联系,构成了一个复杂的作用体。人的心理与行为活动更是受到了遗传、环境等各种因素的交互影响。实验方法通过操纵自变量的方式将该变量分离出来,并通过随机分组等方法保持其他变量不变。不过,要想创设出这种特殊条件,并不像我们本章中所举的例子那样简单,往往需要非常精巧的实验设计。然而实验室的实验饱受诟病的一点在于,它是人为性的,不同于我们的真实生活。那么心理学实验研究的结果能够推论到现实生活中来吗?我们将在下一章进行探讨。
思考与讨论:
因为两件事件存在“相关性”而强加因果关系的行为,会让我们看不到问题的本质。自省一下,在最近的工作、学习、生活中,你有犯过类似的错误吗?
为了在实验中找到问题的真正所在,我们需要知道如何操纵自变量,控制无关因素。这样的思考方法也同样适用于生活与工作。比如,对公司来说,一个产品卖得不好,是产品的问题,还是营销的问题?学生成绩差,是老师的问题,还是学生的问题?请思考,面对这些情况,你会如何设计实验,找出真正需要解决的问题呢?
Day 4
№17 生态效度(一)
今日导读
昨天,我们学习了相关性与因果之间的联系,同时初步了解了在实验中需要考虑的一些问题。阅读之后,你会不会觉得心理学的实验有太多的人为设置,而显得不够“自然”呢?另外,当我们实施了设计严谨的实验,并从中合理地推出实验结果时,是否就意味着我们已经找到了“真理”呢?
今天,我们将探讨以上问题的答案。
为了观测到感兴趣的必要条件,许多心理学实验不得不专门设置一些非自然发生的条件,以便实施精确的控制,将影响事件发生的各种变量分离开来。科学实验的人为性并不是研究者们的疏忽大意,而是有意为之。实际上,若是完全在自然条件下进行观察,许多现象都是很难、甚至是不可能被发现的。在过去的六十多年里,有许多的物理学家和天文学家为证明引力波的存在作出了无数努力,都是徒劳无果。上个世纪九十年代初,美国国家科学基金会开始资助麻省理工学院建造“激光干涉引力波天文台(LIGO)”,耗资近四亿美元,耗时八年建成,多次升级改造,十几个国家超过千名科研人员参与设备运作。直到今年年初,才探测到了引力波的存在。用如此高灵敏度的天文台探测引力波,也要等到宇宙级碰撞事件出现的时候才能够成功,而这种碰撞事件的发生概率,在银河系内平均每一万年才会发生一次,可见在自然条件下观察现象的难度之大。而且就算是LIGO,也是借助了人为设置的激光干涉条纹才能够成功观测到引力波的存在。可见,为了对宇宙更加深刻的理解,使用人为性的方法进行实验设计,确实是合情合理的。不过,如今大概没有人怀疑物理学家进行实验室实验的研究方式,却有不少人质疑心理学家进行实验室实验的合理性。
心理学的实验方法只是将自然科学的技术应用到了人类行为的研究上,与其他学科的做法相比并无二致。为了提高心理学研究的生态效度(指实验结果能够推论到样本的总体和其他同类现象中去的程度),心理学家还非常重视随机取样和样本的代表性,这也大大增加了研究结论的适用性。需要注意的是,随机取样和我们上一章中提到的随机分组是两个完全不同的概念。随机分组是真实验设计的必需条件,通过随机分配,每一名被试被分配到实验组和控制组中的机会完全相等,在一定程度上控制了无关因素对因变量的影响。而随机取样则是针对被试的选择问题。当需要随机取样时,我们要用同一种方法在研究总体中抽取出一个样本进行研究,并且要保证总体中每一个个体被抽中的机会完全相等。比如我们在进行全国老年人心理健康状况抽样调查时,要以全国所有的老年人作为总体,从中选取一部分老年人作为样本进行测量。这个样本的选取就必须是随机化的,以尽可能地避免取样地域、受教育程度、社会经济地位等因素的干扰。
№18 生态效度(二)
不过,并不是所有的心理学研究都需要随机取样。应用研究的目的是将研究结果直接应用到现实生活情境,比如预测民意测验的可能结果,这就需要重视取样随机性和样本代表性的问题。而典型的基础心理学研究,目的在于对理论进行验证,并非为了直接解决实践性的问题,所以并不要求太高的生态效度,也不需将随机取样作为研究的必要条件。这一点其实很好理解,生物学家不会随机抽取细胞做研究,化学家也不会随机抽取化合物做研究,医学研究更不会通过随机取样抓来小白鼠以代表整个物种。心理学的基础研究不关心实验情景能否反映现实生活的情境,但这并不表示基础研究没有应用价值。信息加工理论正是通过实验室中的基础研究所验证,而这一理论现在早已应用到汽车驾驶室的仪表和操作环境设计之中,也成为了用户体验、产品设计的重要理论依据。
并非所有的心理学研究都为了直接预测具体环境下的事件,所以生态效度的问题应该辩证、灵活地去看待。基础研究对理论的每一次验证,都是在为心理学应用于实践夯实根基、积蓄力量。
№19 渐进整合(一)
也许你曾在网络或报刊上看过这样的头条“有机化学领域取得新的飞跃!”“生物实验实现新突破!”——制造这种“突破性”的新闻是媒体用来炒作的惯常伎俩。但是对于科学来说,一项实验恐怕未必能带来整个学科领域的大跨越。尤其是心理学,它缓慢的发展过程不是没有原因的。每一个心理学理论的提出都是慎之又慎,而且绝不会根据一两项实验就能够确定一个理论的有效性,哪怕这些实验的结果验证了该理论的预期假设。相比于“跃进模式”,心理学更注重“渐进整合”,在方法上具体表现为关联性原则和聚合性证据原则。
关联性原则是科学知识体系进行更新时,概念演化必须要遵守的金科玉律。一个新理论的提出,必须要与前人已经确立的实证事实形成关联,也就是说,新的理论不能只针对全新的情境,一定要能够解释旧的事实,并且兼容、囊括旧的知识体系。假若新的理论与已被证实的事实证据相矛盾,说明理论本身就解释不通;若新的理论与旧的科学体系毫无关联,看上去似乎是一项全新的发现,但其实质就像空中楼阁一般,并不具备说服力。不能解释以往事实的新理论,绝不能完全取代旧知识,更不是对过去科学知识的完全超越,只会形成新理论和旧理论相互竞争的态势,直到出现一个更好的理论将二者进行整合。所以,唯有满足关联性原则,一个新的理论才有可能推进科学的进步。爱因斯坦的相对论并没有完全推翻牛顿的经典力学理论,而是为旧理论限定了“宏观世界和低速运动”的边界条件,用新理论解释了更为广泛的现象。这就是关联性原则的必要之处。
№20 渐进整合(二)
科学研究面临着极大的不确定性,这是公众难以意识到的。通过一项科学实验完全确定某个问题,或是支持某个理论并排除其他理论,这简直是天方夜谭。所以,事情并不像媒体和影视作品中描绘的那样,一个实验能发挥那么强的关键作用。科学的共识是渐进整合的,科学家们往往要评估几十个、甚至上百个实验研究的结果,才能得出结论。这些研究虽然各有瑕疵,但是每个研究都能够提供部分的证据和答案,科学就是依赖于对大量研究总体趋势的评估蹒跚曲折前行。
这种证据评估的原则就是聚合性证据原则,也称作操作聚合原则。心理学的研究对象是极其复杂的人类行为活动,所以心理学实验具备高度模糊性的干扰因素,每一个实验的结果都会或多或少受到混淆变量的影响,因此,我们必须通过一系列的实验来相互弥补彼此的瑕疵。假设已有甲、乙、丙三种理论可以解释同一个现象,这些理论都有实证证据证明其存在。我们发现,一部分实验的数据结果支持了甲、乙理论而否定了丙理论,也有一部分实验数据结果支持了乙、丙理论而否定了甲理论。所以,乙理论目前就拥有最强的聚合性证据,因为我们不仅具备证实乙理论的数据,也有证伪与乙理论竞争的其他理论的数据。
只有把大量研究的数据结果汇总起来,我们才能作出最有力的推断。元分析的统计技术就提供了一种更为严谨的方法来整合不同研究的证据。元分析将针对同一现象的不同实验的数据结果汇集起来,组成一个庞大的数据库,以效应量的分析来消除单一研究的不确定性,也为前后矛盾的实验结果、相互对立的理论争议带来一个明确的答案。渐进整合的模式为科学体系的构建提供了一个很好的框架,目前也已经成为了科学界的共识,让我们在追求真理的道路上不断前行。
№21 多重原因(一)
我们能搞明白分子和原子的结构,我们也能弄清楚金星与火星的运行,可我们却无论如何也看不透人心。心理学是一门复杂的学科,有一个重要原因就在于,人的行为是由多重原因共同决定的。影响人心理发展的主要因素可以分成遗传和环境两大方面。遗传即是以基因为传递物质将性状由亲代传递到子代,通俗来讲,就是我们常说的“龙生龙、凤生凤、老鼠生儿会打洞”;环境因素则是自然环境、社会环境等外在因素,对于人的发展而言,家庭、学校、社会是主要的环境因素。关于影响人类心理发展的两大动因,心理学界一直存在着激烈的争论,也被称作“天性-教养”之争。最初,高尔顿、华生等学者认为两类影响因素“非此即彼”,其中一种因素对人的发展起到了百分之百的决定性作用。随着研究的深入,心理学家们逐渐发现,用唯一的原因是无法解释得通许多人类活动现象的,必须探讨各种不同的因素对某种特定行为的影响,并将研究结果加以整合,才能完整地阐释清楚和该行为有关的因果关系。所以,发展心理学家将争论的重点放在了遗传和环境对心理发展的各自的作用大小上,产生了“会合论”和“成熟势力说”;再后来,心理学家们认为二者的作用并不是一种简单可叠加的关系,而是动态地相互交织、共同作用的,由此开启了“相互作用论”的新视角。
与“天性-教养”的理论之争一样,心理学的具体研究也必须具备原因多样性的观念。而人们往往会带着预设偏见,把问题想像成简单的、单维的,想当然地以为导致某种结果的原因只有一个。心理学家们广泛研究过学习障碍的原因,有结果发现学习障碍和脑部的病变有关系,也有研究表明学习障碍还有遗传方面的原因。这样看来,学习障碍似乎纯粹是因为生理方面的问题,但是作出这样的结论是盲目的、不正确的。因为进一步研究发现,早期学校教育中部分指导性经验的缺失、贫困的家庭环境也是造成学习障碍的可能原因,因此学习障碍是环境因素和生理因素交互作用的结果。
№22 多重原因(二)
虽然在大多数心理学研究中,某个单独的变量只能解释某种现象或行为的很小一部分,但是这并不表示这个变量无足轻重。对于一个产值上亿的上市公司来说,员工的工作倦怠也许只是影响其工作绩效的百分之五。但若通过对员工倦怠感的心理干预,就能够使该公司的利润提升五个百分点,那就是数百万的经济价值。所以,多重原因的事实并没有降低任何一个与结果存在因果关系的变量的重要性。
我们在上文中还提到了多种原因对结果影响的交互作用。具体地讲,交互作用就是指一个自变量的影响效果依赖于另一个自变量的不同水平。由于交互作用的存在,多个变量共同作用时的整体效应,会和每个变量单独作用时的效应完全不同。这正是心理与行为研究复杂的地方,也同样是使它神奇和令人着迷的地方。
思考与讨论:
在阅读完今天的内容后,请试着回答以下问题:为什么心理学科学的发展会如此缓慢?为什么想要得出一个结论必须要评估几十个、甚至成百个实验的结果?这么做的意义是什么?
在昨天的思考与讨论中,我们学习了如何操纵自变量,控制无关因素,并设计了一个实验。经过今天的学习后,你会如何完善你的实验呢?你认为你的答案是唯一且正确的答案吗?为什么?请给出论证。
Day 5
№23 概率推论(一)
今日导读
昨天,我们了解了科学心理学对生态效度的取舍,以及其发展缓慢的原因。至此,我们已经明白,一项心理学研究需要经过严谨的设计,一个心理学结论需要基于大量的科学研究。但是,最终得到的心理学结论,是否就可以百分之百地预测人类的行为呢?是什么在影响着预测的准确性呢?相信阅读完今天的内容,你会有所收获。
在本书导读中我们提到,科学心理学始终强调的核心内容是证伪的科学本质和概率推论的思维习惯。前面已经用专门的篇幅介绍了证伪原则,在本章中,我们将具体来探讨概率推理的思维方式。
以面孔识别为例,我们在婴儿的脸上悄悄涂上一点颜料,如果他能发现镜子中的自己的异样,并尝试着去摸脸上的颜料,就表明他已经初步具备了某些自我认知能力。婴儿一般要在出生十八个月之后才能够通过“镜子测试”,明白镜子中就是自己。欧美心理学家们普遍认为,人类最“脸熟”的肯定是自己,对自己面孔的识别也必然是最快的,也有相应的实验研究证明了这一点。那么所有的人识别自己的面孔都是最快的吗?当然不是,面孔识别的研究结果只是反映了一个概率的趋势,只是代表了一种较大的可能性,而不适用于任何的情境。所有的心理学发现都是用概率的方式来表述的,我们无法百分之百地确定一个人的心理和行为活动,只能对大多数人在特定情况下有可能的行为表现的总体趋势加以预测。
不仅是心理学,其他许多学科也会利用概率关系来表达他们的研究发现,比如医学。我们都知道,吸烟会导致肺癌等健康问题。但是每个吸烟者都会患上肺癌吗?每个患肺癌的人都是由于吸烟吗?这显然是不成立的。你可能知道某某人从年轻时起就是每天好几包烟的大烟枪,照样身体硬朗活了九十多岁。这个反例是不是就能推翻“吸烟导致肺癌”的医学结论呢?还记得我们在前文中对个案证据的批判吧,“某某人”的思路显然就是人类非理性认知的惯常错误。用一个特例并无法让一个统计规律失效,无论再强的趋势也总会有少量与之相悖的特例存在,这是概率统计的性质决定的。
概率统计的结论不仅要警惕“鲜活性”个案证据的陷阱,而要注意结论推广的条件。事实上,任何的科学结论都是有边界的。踏出边界一步,真理就有可能变成谬误。还是来说面孔识别的研究,北京大学心理学系的韩世辉教授团队就颠覆了“识别自己面孔最快”的结论,他们发现对于中国人而言,识别老板的脸是最快的。这是因为在集体主义文化中,等级关系对自我意识的影响较大。所以,同样的实验,在不同文化情境中的结论有可能是不一致的。
№24 概率推论(二)
有意思的是,人类的概率推理能力正是心理学家们的一项主要研究内容。许多心理学者都指出,概率推理的基本原则在大多数人的头脑中都没有充分地发展起来。著名心理学家、2002年诺贝尔经济学奖得主丹尼尔•卡尼曼(Daniel Kahneman)教授在对人类决策的研究中发现,相比于理性的、自控的、复杂的“慢系统”思维,人们更容易用经验的、直觉的、自发的“快系统”来进行决策。而学习概率思维,认清统计推理中的误区,能够有效地避免“直觉成为错觉”。
(一)第一个误区:对概率信息利用不充分
我们曾讨论过具体的“鲜活性”事件信息对抽象的概率信息的负面影响,过分看重临床证据而忽视基础比率,就会让我们产生认知错觉。举例来说,假如每1000人中会有1人携带HIV病毒的概率,一种HIV病毒的检查方法具有5%的阳性误诊率(即错误地将未患病的人诊断为患者的概率),我们随便找来一人参加该项检查的结果呈阳性,那么此人是HIV携带者的概率是多少呢?就算许多学过科学知识的人也很容易给出错误的回答。正确的答案不是5%,而是1.96%。
推理的过程是这样的:1000人中只有1人真正携带HIV病毒,在其他999人中,该项检查的虚报率为5%,即是有49.95人被误诊为阳性,再加上那名真正的携带者,一共是50.95人会呈现阳性反应。而这些人中真正的携带者只有1人,所以在结果呈阳性的人中确诊得病的概率只有不到2%。对个案证据线索(5%)的过度重视,才让我们容易忽略对先验概率或基础比率(1‰)的有效利用。
№25 概率推论(三)
(二)第二个误区:对样本大小信息的误用
假设有两家产科医院,大医院每天有50个婴儿出生,小医院每天有20个婴儿出生。如我们所知,婴儿是女性的概率大约为50%,但是每天的具体情况是不一样的。两所医院各自记录了每天降生女婴的比例高于60%的天数,那么哪一家医院记录的天数多呢?“几乎差不多吧”——这是大多数人的回答。我们在这里常常忽略样本量的大小对结果的影响——在不考虑其他因素时,样本量越大,我们的数据结果越接近真相。
你肯定知道抛硬币的游戏。假如我只抛十来次,得到正面的频率未必是50%,而我若是抛数千次甚至上万次,得到正面的频率将逐渐趋向50%。在这个问题中也是同样的道理,小医院由于样本规模较小,更容易得到离总体平均值(50%)较远的结果,所以正确答案是小医院记录了更多女婴比例高于60%的天数。可见,在概率统计中,样本规模是会对结果可信度产生影响的,这对理解心理与行为科学的研究来说至关重要。
(三)第三个误区:“赌徒谬误”
一名赌徒参加“猜大小”的赌局,前三次掷骰子的结果都是“大”,那么下一次赌徒会选择押“大”还是“小”呢?也许他会觉得,“大”已经连续出现了那么多次,下一次出现“小”的可能性比较大。显然,掷骰子是独立事件,先前的结果不会对下一次结果发生的概率产生影响。现在看上去他犯了一个明显的错误,但是生活中我们还是常常扮演“赌徒”的角色进行非理性的决策。许多封建保守的夫妇常常有这样的执念——“我们已经生了三个女孩了,这回一定是个男孩”,也是犯了“赌徒谬误”的认知错误。再如,有一家音乐播放软件公司常常收到用户的意见,许多人抱怨播放器的“随机模式”并不随机,他们常常会碰见同一首歌连续重复播放的情况。我们的确是该为这家公司打抱不平,因为真正的随机抽取不会刻意地让结果无重复地轮流出现。后来,这家公司改变策略,设计了一种“假随机”,用户果然没有同样的抱怨声了。这家公司就是美国的苹果公司,后来的大多数音乐播放器也纷纷效仿iPod,让“随机模式”成为了一种可控的套路。
№26 偶然因素
假设你收到了一封电子邮件,是一家数学团队开办的公司发来的,内容是关于足球联赛中某场比赛结果的免费预测。或许你会不屑地将它丢到垃圾信息,即使你注意到这个邮件真的预测正确了,也会将其归结为侥幸的猜中。过了几天,你又收到这家公司关于下一场球赛的预测,当它又正确预言了获胜的球队时,你可能或多或少有些好奇。当接下来的两场球赛结果纷纷被如期而至的邮件成功预测的时候,你将感到不可思议,同时也会惊叹不已。然后,这家公司邮件告知你,如果你支付400元,他们将为你预测本季联赛所有场次的比赛结果。看起来似乎是个非常诱人的交易,但是如果你掏了腰包,就彻彻底底地上当了。
这家公司的运作方式极有可能是这样的:在一间狭小的出租屋里,几个骗子向8000名球迷发了邮件,一半预测甲队获胜,另一半预测乙队获胜,于是就有4000人收到了成功预测的结果,而另外4000人也丝毫不会在意这封邮件。下一次,他们只需要用同样的方法向成功预测的4000人发送邮件,依然是两种结果各半的预测方式,再下一次他们也只需要给正确预报的一半人发送邮件。依次类推,将会有250人收到连续五次预测正确的邮件,他们中大多数人会认为这个预报足够灵验。哪怕只有50人愿意花400元购买后续的预报服务,这都是一笔不小的收入了。因为对于骗子来说,他们除了发发电子邮件,根本不需要什么成本。
从这个例子可以看出,对球赛胜方的预测原本是一个纯粹的随机事件,由于披上了一层人为编造的逻辑的外衣,就显得像是由可预测的因素造成的。然而目前世界上大多数的事件和现象都无法用系统性的因素完全地解释清楚,我们必须要对偶然的因素足够重视。偶然性和随机性的规律支配着这个世界运行的方式,比如每个生物体在遗传的过程中都会经历基因的重组和变异。心理学所研究的现象更是可解释的系统性因素和暂时无法解释的偶然因素共同地、交互地作用的结果。这也就是为什么心理学者无法回答“你知道我心里在想什么吗”这个问题的原因,因为我们只能对总体趋势作出概率性的预测,而无法精确预测个体的行为。
偶然因素代表着研究中始终存在的不确定性。当一种现象无法被系统的原因解释清楚的时候,千万不要忘记偶然因素的存在,而盲目地将无意义的理论强加于随机的事件。相比于“偶然”,我们更希望把生活中的“巧合”当作是“缘分”或“超能力”。每当这个时候,你就要再好好回顾一下那个球赛预测的骗局了。
№27 形象困境
在导读中我们就提及过心理学的形象问题。以目前的情况看来,民众对心理学存在着极大误解,甚至可以说是对科学心理学一无所知。我们去书店看看展架上陈列的心理学读物就可以明白这一事实。在心理学类的专架上摆放的,要么是早期的经典精神分析心理学著作,要么是充斥着心灵感应、通灵术等超自然现象的伪科学书籍,还有就是介绍各种“心理疗法”自助类书籍,而真正的科学心理学读物则寥寥无几。
书店中的这三类书籍,极大地降低了心理学在公众心中的形象,使心理学看上去就像是一门非常肤浅的学问。我们已经探讨过老式的精神分析观点不为科学心理学所接受的一面,也分析过伪心理学自我炒作的惯常把戏,现在不得不讲一讲自助类读物的误区。
由于大众太渴望了解自己的心理世界,自助类心理学书籍往往能成为书店里的畅销产品。然而市场上的绝大多数自助读物都是励志类、成功学、“心灵鸡汤”式的伪心理学,或者是对老生常谈的人类行为的重新包装。甚至有个别不负责任的心理学专业人士,受利益的驱动,也开始任性地著书立说,声称自己发明了独特的“新疗法”。这些读物很难通过心理学检验程序的验证和严格的同行评审,只会使公众误解心理学的研究内容和目标。毕竟,图书出版和网络传媒都带有商业性质,它们多会迎合消费者的胃口,而少有关注是否科学。
最令心理学研究者们感到失望的是,书店里少得可怜的真正有价值的心理学读物,往往会被归在其他科学类别的图书展架上,散落在计算机科学、生物学、神经生理学专栏的丛书之中。同样的,心理学研究者在高校和科研院所常常会被分到其他学科的院系,心理学家的头衔常常被认知科学家、人工智能专家、社会生物学家等名称所替代。就连当代最杰出的心理学家丹尼尔•卡尼曼(Daniel Kahneman)的心理学研究成果,被授予的都是诺贝尔经济学奖,这导致了心理学的贡献常常被忽略、被掩盖、被抹杀!
有句话叫“人人都是心理学家”,因为我们每个人都懂得使用内省、个人经验、个案和见证等方法来进行心理和行为的分析。然而科学心理学显然触犯了这一套直觉心理学理论的利益,也否认了“人人都是心理学家”的事实,这正是与“伪心理学”背道而驰的地方。
由衷地希望你在读完这本书之后,能够对科学心理学有一定的认识和了解。
思考与讨论:
我们有基于理性与基于直觉的两种思维系统,你在平时的生活中更偏向于哪一种?你觉得这种思维方式有什么好处?又有什么坏处?
读完本书后,相信你已经可以大致辨别真假心理学。请想想,你在朋友圈或公众号文章里看到的心理学知识或是所谓的可选理论中,哪些是披着羊皮的狼?请试着用福尔摩斯般冷静而富有层次的语言揭露它的谬误之处,并记录下来,与同伴分享你得来的真相。