最近带着一波同学读了些心理学文献,收到的很多反馈是不知道如何读文献,理解困难。其实这个主要原因是背景知识建立的不够,同时对实验心理学没理解到位。实验心理学的核心总体概括来讲,是「控制」、「平衡」、「叠加」、「比较」八个字。那么如何理解这八个字呢?

「控制」

做研究会涉及到很多变量,存在各种影响因素,浩浩宇宙我们能研究的问题很多。但如果真要去做一个实证研究,那么需要聚焦、再聚焦,聚焦到一个针孔那么小的问题,来分析研究。

所以我们做的研究,只可能集中在几个因素上,「控制」两字,讲的就是控制「自变量」,这和其它自然学科讲的「控制单一变量法则」原则是一样的。就是我们研究的只是这个变量某几个水平之间的差异,所以需要严格控制好这几个水平,比如我想研究不同情绪类型对词语记忆效果的影响,情绪根据普心中效价维度的划分,分为:积极、中性、消极三种情绪类型。这就是我们的控制条件,就是要研究这三种情绪对词语记忆产生什么样的影响。

「平衡」

讲到平衡,就不得不说噪音,也就是无关变量的干扰。心理学研究之所以应用比较差、泛化不强,一个主要原因是限制条件太多,在研究问题上附加了太多的平衡条件和因素。如我们上面「控制」的是情绪效价的不同,然后情绪维度分为「效价」和「唤醒」。既然我们「控制」了效价的三种条件,那么「唤醒」就是我们需要平衡的因素了。这样得到的研究结果我们才能说是单纯三种不同情绪类型引起的,和唤醒的程度没有关系。因为唤醒程度已经被我们平衡了。如果不进行平衡,就很难说研究结果的差异,具体是因为情绪的类型(也就是效价)引起的,还是情绪的唤醒程度引起的。所以实验中,变化的,即控制的「情绪的效价」,不变的,即平衡的「情绪的唤醒程度」。

「叠加」

我们都知道做一个实验,需要叠加。叠加平均就是实验条件试次数的叠加,一个实验条件会让被试重复做 30 次,然后将这 30 次的结果叠加平均,得到一个值,这个值就作为该被试在这个条件下一个相对真实的水平。因为这 30 次叠加得到的结果,更能体现这个被试的真实水平,可以将标准差降到比较低的程度。比如让被试打靶,他打了一次,环数是 7 环。这个成绩受外在因素影响比较大。但如果让被试打 10 次靶,对环数取一个均值,这就更能体现他的真正实力。这就是叠加平均的作用。

「比较」

前面已经提到,控制的是「自变量」,平衡的是「无关变量」,所以比较的自然就是「因变量」。行为实验的因变量 90% 都是正确率和反应时这两个指标。如我们想知道三种情绪类型(积极、中性、消极)下对词语记忆效果的影响,所以对于记忆效果的衡量最主要是用正确率体现。自变量是我们控制和操纵的条件,最终收集到的数据都属于因变量,这个因变量是用来进行统计检验,进行比较的。自变量在其中的作用是进行比较的前提,就是我们需要根据自变量的条件和水平,筛选出来我们要比较的因变量数据。

进行比较,不是看谁比谁大就可以了,而是要做显著性检验,最常用的统计方法就是 t 检验和 F 检验。两个水平的显著性检验,就用 t 检验。三个水平以上就用 F 检验。这就涉及到心理统计学,也就是要看 p 值,只有 p 值是小于 0.05,才能说比较的结果是有意义的,是成立的。所以如果结果显著,我们就能说三种不同情绪类型,对词语的记忆是有影响的,影响是不同的。至于具体如何影响,就要进一步去分析「简单效应」。如果不显著,就不能说三种不同情绪类型对词语记忆会有影响。所以进行「比较」的一个前提是 p 值要小于 0.05,检验结果要显著。另一个前提是至少要有两个水平,只有两个以上的水平,我们才有比较的对象。所以这就是我们的实验设计,最小的、最简单的一个实验设计是「单因素两水平实验设计」。

总结

我认为心理学最核心的两门学科是测量和实验,然后实验心理学讲究的就是上面八个字「控制」、「平衡」、「叠加」、「比较」。我把额外变量平衡,让它们没有差异,排除无关变量的干扰,保证单一自变量的改变,进而去做因变量数据的比较。比较的前提是要有「基线水平」,所以实验心理学最少要求一个自变量有两个水平,一个是基线条件,相当于零值。如我们上面三种情绪类型,中性情绪就是基线水平。另外一个条件是想要考察的,通过统计分析比较两个条件的因变量(正确率、反应时)是否存在差异。如果有差异,就说明两个条件是存在差别的。这基本就能概括实验心理学的核心了。实验组、控制组本质上是一样的道理。所以行为实验讲究的是「反应时万岁」,很多比较都是通过反应时完成的。

实验心理学的灵魂在于其实验设计的精巧出奇,也是最好玩的一部分。所以大家想学好实验心理学,那么就要了解实验设计,理解那些经典的实验范式,是如何设计的。我们知道一般文献的写法是「漏斗形写作法」,就是引言开头从一个比较大的问题切入,到具体研究问题进行聚焦,也就是漏斗的中间部分,非常细,就代表研究者在探讨非常细微的问题。然后到下半部分漏斗又开始变得非常大,就是从研究方法、研究结果、研究结论逐渐扩大,这就说明我们又从一个细微的结果、结论,被推论、引申到一个比较大的层次和范畴了。不过一篇文献最核心的还是漏斗的中间那部分,也就是研究方法。因此,在读文献的过程中,需要带着这几个问题去思考。它这个实验是解决什么问题,怎么设计这个实验的,自变量是什么,因变量是什么,排除了哪些无关变量的干扰。为什么通过因变量就能解释这个问题。然后它的统计方法是什么,什么样的实验设计,用什么样的统计方法。至于对实验的评价,可以思考一下,研究者是如何做的比较,能分离出什么认知过程,得到什么样的结论,有什么改进的办法。

ChangeLog

  • 200510 ZAPP 根据带着一波同学读文献的心得,总结成初稿。