深入浅出理解实验心理学

最近带着一波同学读了些心理学文献，收到的很多反馈是不知道如何读文献，理解困难。其实这个主要原因是背景知识建立的不够，同时对实验心理学没理解到位。实验心理学的核心总体概括来讲，是「控制」、「平衡」、「叠加」、「比较」八个字。那么如何理解这八个字呢？

「控制」

做研究会涉及到很多变量，存在各种影响因素，浩浩宇宙我们能研究的问题很多。但如果真要去做一个实证研究，那么需要聚焦、再聚焦，聚焦到一个针孔那么小的问题，来分析研究。

所以我们做的研究，只可能集中在几个因素上，「控制」两字，讲的就是控制「自变量」，这和其它自然学科讲的「控制单一变量法则」原则是一样的。就是我们研究的只是这个变量某几个水平之间的差异，所以需要严格控制好这几个水平，比如我想研究不同情绪类型对词语记忆效果的影响，情绪根据普心中效价维度的划分，分为：积极、中性、消极三种情绪类型。这就是我们的控制条件，就是要研究这三种情绪对词语记忆产生什么样的影响。

「平衡」

讲到平衡，就不得不说噪音，也就是无关变量的干扰。心理学研究之所以应用比较差、泛化不强，一个主要原因是限制条件太多，在研究问题上附加了太多的平衡条件和因素。如我们上面「控制」的是情绪效价的不同，然后情绪维度分为「效价」和「唤醒」。既然我们「控制」了效价的三种条件，那么「唤醒」就是我们需要平衡的因素了。这样得到的研究结果我们才能说是单纯三种不同情绪类型引起的，和唤醒的程度没有关系。因为唤醒程度已经被我们平衡了。如果不进行平衡，就很难说研究结果的差异，具体是因为情绪的类型（也就是效价）引起的，还是情绪的唤醒程度引起的。所以实验中，变化的，即控制的「情绪的效价」，不变的，即平衡的「情绪的唤醒程度」。

「叠加」

我们都知道做一个实验，需要叠加。叠加平均就是实验条件试次数的叠加，一个实验条件会让被试重复做 30 次，然后将这 30 次的结果叠加平均，得到一个值，这个值就作为该被试在这个条件下一个相对真实的水平。因为这 30 次叠加得到的结果，更能体现这个被试的真实水平，可以将标准差降到比较低的程度。比如让被试打靶，他打了一次，环数是 7 环。这个成绩受外在因素影响比较大。但如果让被试打 10 次靶，对环数取一个均值，这就更能体现他的真正实力。这就是叠加平均的作用。

「比较」

前面已经提到，控制的是「自变量」，平衡的是「无关变量」，所以比较的自然就是「因变量」。行为实验的因变量 90% 都是正确率和反应时这两个指标。如我们想知道三种情绪类型（积极、中性、消极）下对词语记忆效果的影响，所以对于记忆效果的衡量最主要是用正确率体现。自变量是我们控制和操纵的条件，最终收集到的数据都属于因变量，这个因变量是用来进行统计检验，进行比较的。自变量在其中的作用是进行比较的前提，就是我们需要根据自变量的条件和水平，筛选出来我们要比较的因变量数据。

进行比较，不是看谁比谁大就可以了，而是要做显著性检验，最常用的统计方法就是 t 检验和 F 检验。两个水平的显著性检验，就用 t 检验。三个水平以上就用 F 检验。这就涉及到心理统计学，也就是要看 p 值，只有 p 值是小于 0.05，才能说比较的结果是有意义的，是成立的。所以如果结果显著，我们就能说三种不同情绪类型，对词语的记忆是有影响的，影响是不同的。至于具体如何影响，就要进一步去分析「简单效应」。如果不显著，就不能说三种不同情绪类型对词语记忆会有影响。所以进行「比较」的一个前提是 p 值要小于 0.05，检验结果要显著。另一个前提是至少要有两个水平，只有两个以上的水平，我们才有比较的对象。所以这就是我们的实验设计，最小的、最简单的一个实验设计是「单因素两水平实验设计」。

总结

我认为心理学最核心的两门学科是测量和实验，然后实验心理学讲究的就是上面八个字「控制」、「平衡」、「叠加」、「比较」。我把额外变量平衡，让它们没有差异，排除无关变量的干扰，保证单一自变量的改变，进而去做因变量数据的比较。比较的前提是要有「基线水平」，所以实验心理学最少要求一个自变量有两个水平，一个是基线条件，相当于零值。如我们上面三种情绪类型，中性情绪就是基线水平。另外一个条件是想要考察的，通过统计分析比较两个条件的因变量（正确率、反应时）是否存在差异。如果有差异，就说明两个条件是存在差别的。这基本就能概括实验心理学的核心了。实验组、控制组本质上是一样的道理。所以行为实验讲究的是「反应时万岁」，很多比较都是通过反应时完成的。

实验心理学的灵魂在于其实验设计的精巧出奇，也是最好玩的一部分。所以大家想学好实验心理学，那么就要了解实验设计，理解那些经典的实验范式，是如何设计的。我们知道一般文献的写法是「漏斗形写作法」，就是引言开头从一个比较大的问题切入，到具体研究问题进行聚焦，也就是漏斗的中间部分，非常细，就代表研究者在探讨非常细微的问题。然后到下半部分漏斗又开始变得非常大，就是从研究方法、研究结果、研究结论逐渐扩大，这就说明我们又从一个细微的结果、结论，被推论、引申到一个比较大的层次和范畴了。不过一篇文献最核心的还是漏斗的中间那部分，也就是研究方法。因此，在读文献的过程中，需要带着这几个问题去思考。它这个实验是解决什么问题，怎么设计这个实验的，自变量是什么，因变量是什么，排除了哪些无关变量的干扰。为什么通过因变量就能解释这个问题。然后它的统计方法是什么，什么样的实验设计，用什么样的统计方法。至于对实验的评价，可以思考一下，研究者是如何做的比较，能分离出什么认知过程，得到什么样的结论，有什么改进的办法。

ChangeLog

200510 ZAPP 根据带着一波同学读文献的心得，总结成初稿。

刘旭的网志