2019 年,心理学领域有哪些论文对你特别有启发?

做科研肯定需要读论文。论文作为科研进展的记录,承载了科研工作者的突破。那么,这一年里,有什么心理学领域的论文对你有启发呢?
关注者
72
被浏览
5,936
登录后你可以
不限量看优质回答私信答主深度交流精彩内容一键收藏

2019年值得关注的心理统计学文章

作者: 袁帅

荷兰心理统计联盟”推出两期年终盘点特别节目,介绍2019年心理统计领域最值得关注的研究报告;今天的第一期我们将特别关注那些讨论,修正和规范过往研究和统计方法的报告,也呼应在心理学如火如荼的“开放科学”风潮;第二期我们将重点介绍一些崭新的统计方法,以期提供给研究者更强有力的研究武器


我们当然也只是精力和能力相当有限的凡人,因而这两期年终盘点难以避免地有以下局限性。第一,我们搜集的文章集中在发表于2019年的心理统计(和管理学统计)的三本刊物上——<Psychological Methods>, <Advances in Methods and Practices in Psychological Science> 和 <Organizational Research Methods>,其他知名期刊当然也有很重要很有意思的研究报告,很遗憾我们的盘点无法涉及。第二,判断文章是否重要(值得关注)是一个很主观的过程,事实上我们认为几乎所有发表在顶级心理统计期刊上的文章应该都是相当重要的;限于篇幅我们只能做出取舍,所依据的是我们相对主观的判断。第三,很遗憾再次限于篇幅,我们在盘点中对各文章的介绍相当简单和粗略,我们鼓励读者自行阅读感兴趣文章的全文,以真正掌握其精髓。废话不多说,以下是第一期中我们盘点的六篇文章(排名不分先后)。


文章1

在新方法涌现的当下,如何保障分析的可复制性

简单介绍和评论:

近几年来,以R为代表(还包括JASP,python)的免费开源统计软件以迅雷不及掩耳盗铃之势席卷心理学和管理学研究,极大程度上方便了研究者使用最新的统计方法,也因为代码的易传播性助推了心理学研究结果的可复制。然而, Epskamp的这篇文章强有力地指出R的广泛流行也对可复制性提出一定程度的挑战:第一,很多R的统计软件包还没有开发完全(比如很多beta初始版本),这些统计软件包(相比于付费软件如SPSS和SAS)无法保障计算完全可靠;第二,相当一部分统计软件包(甚至是相对常用的一些)及所使用的方法没有经过严格的验证(比如发表同行评审的论文),因此其可靠性难以得到保障;第三,站立在巨人的肩膀上,统计软件包大部分都有其仰仗的前序软件包(dependencies),因此软件包本身或者任一前序软件包的版本更新都可能导致运算结果发生改变。作者进而对研究者提出几点建议,包括推荐使用经过同行评审的经历时间考验的软件包,不仅提供分析的代码也提供分析的数据,注意所使用软件包的版本并在论文中明确指出,在编程过程中详细记录各个步骤的产生原因,以及尽可能检查代码中的错误。


文献:Epskamp, S. (2019). Reproducibility and replicability in a fast-paced methodological world. Advances in Methods and Practices in Psychological Science, 2(2), 145-155.


文章2

提升二手数据分析透明度的一些建议

简单介绍和评论

开放科学(open science)在心理学和管理学领域已经被广为接受和传颂了,她包含提升数据的易得性,在分析前预先注册假设,和提供所有分析过程这几个最重要的元素。在Weston等人的这篇文章里,他们讨论了开放科学一个重要但是被之前研究忽视的课题——对二手数据分析的透明度和可重复性。作者们认为,二手数据在获取代价较小,样本量相对较大这些优势之外,也不可避免地包含一些劣势,最为重要的是其中所使用测量的信度难以保障和控制,以及它在开放科学议题上的天然劣势——二手数据包含的大量变量使得“故意寻找显著性(p-harking)”轻而易举;与此同时,研究者(特别是之前使用过该数据的研究者)对其中很多变量和其相互关系有着非比寻常的知识。有鉴于此,作者提出了一系列建议来提升二手数据分析过程中的透明度,包括详细记录数据使用的情况(尝试了哪些变量,获得了怎样的结果);清晰完整地列出数据预处理的过程和使用的统计软件语句;在分析之前预注册假设;以及通过一些诸如交叉验证(在一个完全独立的新数据集上重复之前分析的结果)和稳健性检验(考察删除或添加一些控制变量对结果带来的影响)之类的统计方法增加结论的可靠性。


文献:Weston, S. J., Ritchie, S. J., Rohrer, J. M., & Przybylski, A. K. (2019).Recommendations for increasing the transparency of analysis of preexisting data sets.Advances in Methods and Practices in Psychological Science, 2(3), 214-227.


文章3

有序回归建议操作指南

简单介绍和评论:

问卷法研究是毫无争议的心理学和管理学中最常用的研究方法之一。问卷法中包含的里克特量表(也是参与心理学研究的人对心理学最根深蒂固的刻板印象之一)会输出五点或七点的有序回答(例如从“极不喜欢”到“极喜欢”)。心理学和管理学家们对此最常用的数据分析策略就是把它当作连续变量,殊不知,这一将有序变量当作连续变量的过程可能会导致例如ANOVA等分析的假设难以成立,体现在以下三个方面:(1)很难说有序变量不同等级之间是等距的,例如“极不喜欢”到“非常不喜欢”的距离可能比“较不喜欢”到“中立”的距离近得多,这违背了连续变量的一个基本原则;(2)有序变量的分布不一定能够符合正态分布(例如最低等级“极不喜欢”和最高等级“极喜欢”可能有着数量最多的拥趸);(3)有序变量的使用导致各被试组的方差很有可能不同。这也使得把有序变量当作连续变量很容易导致一型和二型错误的增加,错误的效应量估计,甚至混淆的效应方向性。在指出这一问题之后,Bürkner介绍了有序回归(即因变量是有序变量的回归模型)的基本概念和三种最为常用的模型及其分别适用的有序因变量种类:累积模型(cumulative model),其对应的有序因变量源自对于连续变量分类的结果(例如里克特量表测量“幸福感”的有序变量是对于幸福感这一潜变量分类的结果);序列模型(sequential model),其对应的有序因变量来自于一个序列(例如前女友数量来自于一个1开始的数字序列);和相邻种类模型(adjacent-category model),它所对应的有序因变量无法很好用之前两种模型来形容,这一模型主要通过其数学模型来定义。作者同时提供了适用R软件包brms完成有序回归的代码,示例和展示。


文献:Bürkner, P. C., &Vuorre, M. (2019). Ordinal regression models in psychology: a tutorial.Advances in Methods and Practices in Psychological Science, 2(1), 77-101.


文章4

多重比较的最新指南

简单介绍和评论:

ANOVA大概是所有心理学和管理学者最为熟悉的初等统计方法之一了——我们大概都还记得本科心理统计课上被它支配的恐惧。在单因素ANOVA显著之后,倘若有不止两个组,我们都学过通用的做法就是用配对比较(或者说多重比较)去验证各个组之间的均值是否相同。Sauder的这篇文章真是着眼于确定配对比较所应该关注的统计程序上。作者们指出SPSS可以给出多达18种不同的程序,使得研究者异常困惑。他们通过仿真模拟的方法考察在ANOVA的假设(各组的样本量相同,各组的标准差相同)不能得到满足的情况下,哪些程序能够兼顾不犯太多的一型错误和令人满意的统计效力。他们发现了四种程序是相对更好的:Dunnett’s C, Dunnett’s T3, Games-Howell, 和 Tamhane’s T2。有意思的是,我们最熟悉的Bonferroni, LSD 和Tuker’s HSD 都不是被推荐的程序。


文献:Sauder, D. C., &DeMars, C. E. (2019). An Updated Recommendation for Multiple Comparisons.Advances in Methods and Practices in Psychological Science, 2(1), 26-44.


文章5

探索性因素分析确定因子个数的最新指南

简单介绍和评论:

探索性因素分析同样毫无疑问地位列最常用的心理统计方法,同时也是我们本科阶段心理统计课程中最先和最多接触的方法之一。探索性因素分析中最为关键的问题之一就是确定模型中潜变量(即因子)的数目。教材中最常见的方法是Kaiser-Guttman 标准(保留所有特征值大于1 的因子)寻找特征因子图像中的拐点(Scree Test)。几年来,一些其他标准也被提出;加在一起总共有不下十种确定因子数量的方法,这也给实际研究带来了相当程度的困扰。Auerswald在这篇文章中探索了所有这些确定因子数量的方法在三种情况下的表现:只有一个潜在因子,有几个不相关的因子,以及有几个相关的因子。前两种情况下,基于主成分的平行分析(parallel analysis),Hull方法和一个改进版的Kaiser-Guttman 标准表现得最好;在最后一种情况下,数据比较法(comparison data)和序列卡方检验(Sequential chi-square model test)表现得最好。更有意思的是,作者建议把其中的几个指标联合起来分析,以得到最佳的因子选择方法——他们发现如果序列卡方检验和基于主成分的平行分析得到同样的因子个数,在绝大多数情况下这也是正确的因子数量。


文献:Auerswald, M., &Moshagen, M. (2019). How to determine the number of factors toretainin exploratory factor analysis: A comparison of extraction methods under realistic conditions.Psychological Methods.


文章6

基于实验数据的结构方程模型

简单介绍和评论:

本文的作者注意到一个有趣的事实——虽然结构方程模型被非常广泛用于对于问卷数据的处理;绝大部分实验数据的处理却依然仰仗非常原始的ANOVA。他进而指出ANOVA有着非常严苛的、绝大部分条件下难以满足的假设:ANOVA的使用需要假设因变量是被完美测量的,没有测量误差;ANOVA只能考察实验的不同条件对因变量的直接作用,因而无法同时考虑操纵检验;虽然ANOVA可以加入协变量(ANCOVA),但是协变量不允许和其他协变量或操纵因素相关,并且各组在协变量上的效应也必须相同。正是因此,作者进一步推荐两种结构方程模型用以分析实验数据:多指标多因素模型(multiple-indicator-multiple-cause, MIMIC)和结构均值模型(structured-means-modeling)。前者更为大家所熟悉,它的一个重要假设(而后者并没有这一假设)是所有组的测量模型完全相同(即测量具有不变性);其他假设还包括包含其中的因变量,协变量和操纵检验的方差需要在各组中保持同质性。换句话说,前者(MIMIC)是一个包含更多假设,更为简化的模型;后者(SMM)是一个假设更少也即更为复杂的模型。实际使用的过程中,本文作者推荐先尝试更为复杂的模型,在样本量不够的情况下再使用简单的MIMIC模型;我们做出相反的推荐——为了保证模型不过度拟合,研究者需要先从简单的模型开始,如果模型没有很好的拟合(通过结构方程模型的一些拟合诊断指标),辅以对残差的可视化分析,再过渡到相对更复杂的模型。


文献:Breitsohl, H. (2019). Beyond ANOVA: An introduction to structural equation models for experimental designs.Organizational Research Methods, 22(3), 649-677.


2019年值得关注的心理统计学文章(下)

下面就是我们严格筛选的七位方法学的小鲜肉:

文章1:固定效应模型和随机效应模型的永恒斗争


文献:McNeish, D., & Kelley, K. (2019). Fixed effects models versus mixed effects models for clustered data: Reviewing the approaches, disentangling the differences, and making recommendations. Psychological Methods, 24(1), 20.


近年来的心理统计研究有了一个非常好的趋势——原本“隔行如隔山”,心理统计学家永远不和经济统计学家讲话,最近这些专业壁垒成了陈年旧事(很遗憾的是,对于研究者而言往往是加倍的工作量)。本文(特别是一作)就一直致力于比较心理学研究中最最常用的随机效应模型(random effects model)和经济学研究中最最常用的固定效应模型(fixed effects model)。考虑到我们读者的背景,先来说说随机效应模型的(相对)好吧——(1)当二层单元(例如国家)数量巨大的时候,固定效应模型需要制造成百上千个二分变量(binary variable),使得模型估计和解释异常复杂;随机效应模型将这一复杂度大大简化(2)即使模型大于两层,也全都不是事儿(固定效应模型就一般无法处理三层及以上的模型);(3)复杂的跨层中介(mediation)模型(比如国家变量 – 国家变量 – 个体变量)可以被轻松处理固定效应模型当然也不是窝囊货,它相对好处在于(1)二层单元数量只有少数几个也行(随机效应模型需要至少三十个单元)(2)也是原文作者最重要的一个论点,固定效应模型中,被忽略的变量(omitted variable)只会造成一层(个体)效应的偏差,而随机效应模型对一层和二层效应的偏差都要负责。本文更厉害的地方在于他们不仅抱怨,还针对随机效应模型的这一弱点给出了很好的解决方法——采用随机效应模型,但是对一层预测变量进行组中心化(group-mean centering),再把得到的组均值(group mean)加入第二层模型中。

文章2:心理学和大数据的浪漫邂逅


文献:Jacobucci, R., Brandmaier, A. M., & Kievit, R. A. (2019). A practical guide to variable selection in structural equation modeling by using regularized multiple-indicators, multiple-causes models. Advances in methods and practices in psychological science, 2(1), 55-76.


本文是心理学和大数据的浪漫结合。传统的结构方程模型作为一种因果推理的方法,使用之前当然需要指定那些预测变量和结果变量。大数据来了之后,这种指定似乎成了一种负担——手上明明收集了所有和员工工作表现相关的将近一百个变量,你让我怎么选出最最最相关的。另一方面,如果把这一百个变量全部作为预测变量加入预测模型,一来你的电脑可能因工作超负荷和你决裂,二来你手上的数百个被试相对那么那么多要估计的模型参数显得异常卑微。这个时候你就需要本文介绍的带惩罚因子的结构方程模型。本文中的模型用频率学进行极大似然估计,另一种建模和估计方法是中山大学潘俊豪老师作为主要贡献者之一的贝叶斯估计。毫无意外,本文的方法可以用统计软件R实现,软件包的名字是regsem。希望对这一变量选择方法或者其他变量选择方法有更深入了解的,请参考我们早期的一篇推文:行为科学中的变量选择,或者直接与我们联系。

文章3:纵向模型的分久必合


文献:Usami, S., Murayama, K., & Hamaker, E. L. (2019). A unified framework of longitudinal models to examine reciprocal relations. Psychological methods.


这篇文章可谓是新兴纵向面板模型(也是心理学研究中最常见的数据类型啦)的集大成者之一,把我们熟悉的交叉滞后面板模型(cross-lagged panel model),带随机截距的交叉滞后面板模型(random-intercept cross-lagged panel model),潜变量增长曲线模型(latent curve model),潜变量计分模型(latent change score model)等等老朋友一网打尽,统一在一个框架之下。这篇文章最绝妙的地方在于把原本看似东一锤子,西一榔头毫不相关的事情,巧妙地联系在了一起。不仅如此,对各位读者而言,最重要的也在于作者令人信服地论证了其中的一些模型要比另一些模型更能回答研究问题,相信这在不久的将来将成为纵向研究重要的指标。作者区分了拟合纵向变化趋势(trajectories)和不拟合变化趋势这两种情况;交叉滞后和带随机截距的交叉滞后模型属于前者,潜变量增长曲线和潜变量计分模型属于后者。如果数据表明变化趋势并不明显或者不是研究者关心的话题,那么前者更适合用来建模;如果变化趋势真正是研究者的兴趣所在,后者才是你的真爱。在前者的两个模型中,带随机截距的交叉滞后模型是更推荐的模型,因为她非常细致地区分了被试间(inter-individual)和被试内(intra-individual)效应。我的私心里,这篇文章近乎是2019年最佳论文了,极其推荐一读!另两个姊妹篇很有启发性的纵向数据处理文章是Zyphur等人将要在2020年发表的双连击,是一个比带随机截距的交叉滞后模型更普(复)适(杂)的模型;预知详情,点击“阅读原文”,并且持续关注我们的联盟公众号(我们打算推出详细解读)。

文章4:线性变化?你落伍了


文献:Suk, H. W., West, S. G., Fine, K. L., & Grimm, K. J. (2019). Nonlinear growth curve modeling using penalized spline models: A gentle introduction. Psychological methods, 24(3), 269.


这一篇研究向心理学研究者介绍了全新的一种纵向数据分析方法——有一个非常奇怪的中文名字——带惩罚因子的样条模型(Penalized spline models; PSM);这种分析方法特别适用于每个被试收集了很多(>30)数据点的情况(例如通过经验取样法(Experience sampling methods)获得的数据)。相比于原有线性模型为主导的模型,它独一无二的优势是能够拟合复杂曲线;当然过于复杂的模型显而易见地辣眼睛,因此这个方法也纳入惩罚因子(这里用的惩罚因子有点类似于(大家可能比较熟悉的)ridge 回归),尽可能防止过度拟合的发生。为了取悦心理学读者(误),本文的作者介绍了一种采用线性混合模型进行模型拟合的思路。这个模型既可以拟合单独一个被试的曲线(例如希望形成对于单独被试的个性化治疗手段),也可以把所有被试放在一起用分层模型的方法拟合适用于大众的曲线。特别特别好的消息当然是作者提供了全套分析的R代码,供大伙把玩。

文章5:贝叶斯因子的小白指南


文献:Hoijtink, H., Mulder, J., van Lissa, C., & Gu, X. (2019). A tutorial on testing hypotheses using the Bayes factor. Psychological methods.


贝叶斯因子(Bayes Factor)由于能够直接考察对于零假设(Null Hypothesis)的(相对)支持程度而在近几年间被大力倡导应用在心理学各研究领域(很多杂志甚至要求在报告p值之外必须报告贝叶斯因子的值)。本文作者提供了一个直白易懂、毫无技术壁垒的贝叶斯因子在心理学研究中的使用指南,同时提供了相应的统计软件(软件包bain;强烈推荐)R代码,使得贝叶斯因子能够非常轻易地被运用在(即使是统计小白的)研究中。值得一提的是,华东师范大学的顾昕老师是本文作者之一,也是统计软件包bain的主要作者之一。

文章6:贝叶斯因子还是有局限的。。


文献:Tendeiro, J. N., & Kiers, H. A. (2019). A review of issues about null hypothesis Bayesian testing. Psychological methods.


这篇文章和上面一篇贝叶斯因子指南相映成趣,在贝叶斯因子被极其广泛应用的时候依然选择“做一个清醒者”,提出了贝叶斯因子在检验假设过程中的局限性。在我看来,最重要的局限性在于计算贝叶斯因子过程中使用到的先验分布(prior distribution)将会很大程度上影响到贝叶斯因子最终的取值;而在心理学很多应用中,统计软件提供的先验分布往往并不是最理想的分布。当然,在这些局限性之下,相比于传统的p值,贝叶斯因子还是具备能够考察零假设(相对)支持程度这个无与伦比的好处。一个比较推荐的做法是(1) 在使用贝叶斯因子的时候务必谨慎选择合适的先验分布和(2)在最终报告贝叶斯因子的时候不厌其烦地同时报告所选用的先验分布。最后,不出意外地,本文的两位作者还提出采用常规贝叶斯估计(Bayesian Estimation)来替代贝叶斯因子;文章还没有正式发表,有兴趣的朋友可以搜索两位的名字一睹为快。


文章7:一起追求靠谱的因果推断


文献:Rocha, V., Van Praag, M., Folta, T. B., & Carneiro, A. (2018). Endogeneity in Strategy-Performance Analysis: An Application to Initial Human Capital Strategy and New Venture Performance. Organizational Research Methods, 1094428118757313.


这篇文章采用宏观的视角,提出和展示了一种全新的解决复杂内生性问题(endogeneity)的方法;可谓是四位作者的一小步,是管理学因果推论的一大步。作者肯定了前人研究(主要是管理学战略等宏观领域)慢慢引入一些解决内生性问题的统计方法(不过强调在人力资源和组织行为研究领域,内生性往往被难过地忽视了),不过也提出了他们的批判。三个重要的内生性问题被忽视了:(1)往往有些没有被研究者测量的变量(omitted variable)会影响公司最终的策略选择;(2)公司经常需要同时选择多重策略,而且这些选择不仅仅是领导的锅,也会受经营环境和员工的影响;(3)领导自己的偏好和风格会影响公司决策。可想而知,这些问题不仅仅在组织管理的宏观层面(战略)非常重要,在微观层面(组织行为)也是急需解决的问题。是不是特别好奇这些问题怎么被解决的?还不快找来原文阅读?



本文作者:袁帅

图文排版:秦雅慧

该文章由荷兰心理统计联盟原创,未经授权,不得匿名转载。转载事宜后台联系,或邮件:infohpa2019@gmail.com

新内容预告及合作者招募:自2020年起,荷兰心理统计联盟拟对于发表在Psychological Methods 和Organizational Research Methods(季刊)的文章进行深度解析(每期文章的核心内容及应用),以便我们研究者能够了解最新的统计方法。如果您对统计方法感兴趣,有意向参与我们的活动,欢迎在文章底部留言,或后台联系我们。


往期精选

2019年荷兰心理统计联盟推文合集