Upgrade to Pro — share decks privately, control downloads, hide ads and more …

the meta-analysis method

hbrls
April 01, 2010

the meta-analysis method

跨文化心理学课程论文

hbrls

April 01, 2010
Tweet

More Decks by hbrls

Other Decks in Education

Transcript

  1. 整合分析(Meta-Analysis)方法的应用 心理与认知科学学院 51083200060 徐帅哲 1 概述 随着全球化的进程以及远距离交流方式越来越便捷,文化和跨文化心理研究 逐渐成为了讨论热点,发表在各级刊物上的跨文化心理学研究的文章也越来越多。 多民族的流动与不同文化间的融合使得我们有机会观察到来自不同文化人群的心理 和行为之间的共性以及差异,但在研究发展的早期,多数学者采用了直接对比不同

    国家被试在某一变量概念上的区别的方法。然而这些研究却呈现出了自相矛盾的结 果,例如澳大利亚被试和阿根廷被试在简单认知实验中的表现几乎一样,而在保加 利亚和比利时进行的高级认知任务实验中,双方被试成绩迥异;这样我们就几乎不 可以简单的凭借文献回顾来了解不同文化人群在某一变量概念上的差异,也间接的 降低了研究本身的功效,或者说没有实现研究的可重复性。 整合分析(meta-analysis)是现代科学研究中一种新的研究手段和方法, 旨在采用统计合并的方法对同一主题下的先前研究结果进行综合评价,以先前研究 结果作为观察单位,对文献资料进行再分析以得到对研究结论的总的支持;整合分 析包括质性部分(对已有材料赋予有效性权重)以及量化部分(整合和标准化的过 程)。该分析方法的核心假设是不同的研究具有不同程度的信效度,它们被赋予的 不同权重源于其不同的样本量大小、测量参数等等统计学原因,于是这样一种较为 客观的的“文献综述”方法能更有效的利用到过往文献的全部信息。 Karl Pearson 在 1904 年关于预防伤寒免疫血清的预防效果的报告中提出应 当运用正式的技术对合并不同样本的数据进行分析,他的理由是:“若考虑其中可 能存在的错误,许多观察组„„样本过小,难以产生任何明确意见。”首次研究数 据整合分析的文献发表于 1955 年,他们对各种差异非常大的条件如术后伤口痛、 咳嗽和心绞痛等应用安慰剂的有效性的平均值进行了计算,安慰剂对 35%的病人有 显著效果。Meta-Analysis 这一术语由心理学家 Glass 于 1976 年在研究心理疗法 的有效性时正式提出,并命名了了效应规模(effect size)这一重要概念。社会 科学很快接受了整合分析技术,Der Simonian 和 Laird 改进了 Cochran 法,构造 了随机效应模型,打破了 Meta 分析中传统的假设,引进了研究间方差权重, 使其
  2. 更符合事实,Hedges 提出了小样方的校正方法。90 年代,生态学家 Gurevitch 发 展了混合效应模型,1997 年又提出了适合生态学的重取样检验法,并发行了她的 MetaWin 软件。有研究者称整合分析对绝大部分中国学者来说还是个陌生的名词, 也尚未进入真正的应用时期,它在我国医学、教育心理学和生态学等领域的应用前

    景非常广阔。 2 整合分析的基本过程 Hall & Rosenthal 认为进行整合分析没有唯一的正确的方法,只有三个基 本的策略:准确、简单、明了。最佳的科研方法是不经修饰、直接针对问题,用简 单的统计技术进行分析的方法,简约原则与紧扣数据有助于避免对统计技术的误 解。完整的整合分析方法主要包括研究设计及资料收集、研究编码、效应规模计算 及比较等几个关键步骤。其中国内学者张鑫等指出编码手册应当包括研究认证信 息、中介变量编码、研究质量编码、研究设计编码、效应规模计算信息编码等重要 标准。 效应规模(effect size)计算是整合分析中的核心内容,其计算方法主要 依赖于原文献数据的报告形式。心理学研究中使用频率较高的效应规模计算方法以 平均值、样本大小和标准差的形式进行报告。对于这类数据,效应值计算的宗旨是 将实验组和对照组的差值进行标准化,以方便对不同来源的数据进行比较与合并。 Hedges 估计值 g Hedges 对 Glass 提出的估计值进行了改进,用实验组和对照组的混合方差 来标准化平均值差: 2 ) 1 ( ) 1 ( g 2 2         c e c c e e c e N N S N S N S S x x , Hedges 估计值 d 当样本含量较小时,g 值会表现出偏差,Hedges 在 1985 年提出了校正偏差 公式,当样本含量不小于 5 时,d 就能够很好的表达实验组和对照组间的差别: 1 ) 2 ( 4 3 1 ) ( d       c e c e N N J S J x x ,
  3. 整合分析的同质性检验 整合分析是假定各研究都是检验的同一假设,进行同质性检验是各研究结果 合并的基础,Rosenthal 和 Rubin 提出了有关检验效应规模是否齐性的方法: 2 2 2 8

    2 ) ( d N w d d w      , Χ , 2 Χ 的自由度是 K-1,K 是的研究的个数 效应规模的整合 Hedges 在 1982 年提出了效应规模无偏估计的方法,他认为当实验组和控制 组的样本容量>10、效应规模<1.5 时,该加权方法非常有效和精确:    w wd d Cohen 提出的鉴别标准是:d<0.2(小效应)、0.2<d<0.5(中等效应)、 d>0.5(大效应)。 3 整合分析在跨文化领域中的应用 整合分析能够剔除来自不同文化的研究过程中的样本波动以及系统误差,使 得跨文化差异的实际值得到了标准化,利于比较。目前大多数的跨文化研究都是基 于同一测量工具在不同国家的应用和结果,例如 Khaleque 和 Rohner(2002)试图 比较监护人接纳/拒绝程度以及心理调试的测量在不同国家实测中的信度系数, 他 们就是将 10 个国家分成 4 个区域进行了总分比较。Bond 和 Smith(1996)以 Asch 的线段社会服从实验为主题,从 17 个不同国家和地区选取了 133 项研究进行整合 分析对比。他们检查了一系列有关中介变量以及文化中介变量的影响,结果表明, 文化层面的中介变量如个人主义和 Schwartz 分值与社会服从程度的效应规模呈现 显著相关。而在 Van Ljzendoorn 和 Kroonenberg(1988)的另一项研究中,他们 从 8 个不同文化地区选取了 32 项研究报告并做了整合分析,实验研究的主题是关 于婴幼儿时期的亲子依恋形式,但整合分析的结果表明国家内的效应值差异要多于 国家间的。该结果表明通过对大量文献的量化综合分析,客观的数据可以支持依恋 形式的跨文化一致性这一观点。整合分析的方法使得量化对比跨文化研究的成果成 为了可能,同时还可以针对结果进行深度数据挖掘:中介变量不一定必须是研究者 在实验过程中设计观测的数据,也可以直接是以文化分类作为被检验的对象;在实 际的众多研究中,引入国家/区域/文化编码也是一种十分常见的设计方式。 另有一种声音题出了“基于主题”的整合分析。持该意见的学者注意到这样
  4. 一个事实,即使用同一测量工具或研究方法在不同国家和地区进行研究的报告并不 多见,而且由于语言习俗甚至文化自身的原因,多数工具在被引入他国研究的时候 都经过了改良。这样也就意味着实际能被纳入整合分析范围的报告数量大大减少, 也即忽视了类似研究之间的积极促进意义。由于在“基于主题”的跨文化研究中, 被纳入分析范围的报告方法丰富多样,所以直接检验差异的绝对效应规模是没有学 术价值的,该方法的优势在于积累了更丰富的数据和变量来源,可以利用更多的中 介变量来充分解释研究结果。Hemert,Poortinga 和 Van de

    Vijver (2003)搜集 了情感(emotion)这一主题下的 190 份跨文化研究,具体涉及到“主观幸福 感”、“面部表情识别”等内容。结果显示原先观察到的跨文化效应可以部分被系 统误差解释掉,其中方法设计相关因素可以解释 14.8%,其他因素可以解释 13.3%。与此类似的是 Van Hemert,Van de Vijver 和 Poortinga(2003)搜集并 整合分析了有关心理学、精神病学、知觉、认知、人格等 5 个主题下的 219 项研 究,单纯的文化因素解释了跨文化现象差异中的 13.2%,方法设计解释了 15.2%, 而统计误差解释了 9.5%,三者之间并无明显差别。这些例子很好的说明了在对比 类似跨文化研究时引入一种客观对比机制的重要性。 4 对整合分析方法的评价 传统的叙述性综述有其不足之处,而荟萃分析似可克服这些缺陷。典型的综 述是主观的,因此它易引起偏差和误差。仅仅依靠专家观点作指导,文献回顾可能 对一些基本问题产生分歧,如应该包括何种类型的研究,应该如何平衡所获得的定 量证据。传统的对研究结果综述的方法是计算从各方面支持该一论点的 研究的数 目,并选择得到最多认同的观点。这个步骤忽视了样本大小、作用大小和研究设 计,并且往往忽略了微小的,但可能有重要意义的差别。从同一证据实体得出的相 反的结论可能原因是来自于评论家的权威程度而不是数据本身。因此当遇到原始研 究、传统的综述意见不一时,整合分析可以帮助解决不确定性。 同时尽管整合分析已经得到了广泛应用,但它一直是一项引起争议的技术。 一些拥护者认为整合分析应取代传统的单主题的文献回顾,而反对者其他的人则把 它看作是一个“新的数学主义祸根”,一种“不受欢迎的统计病态面孔”。从跨文 化研究的角度来看,整合分析方法提供了一个新的简单易行的思路,但从具体学科 实际应用的角度来看,合并一组研究的结果也许并不适合,因为它生成一个群体 “平均”效果,而不是针对某一特定方向的结论,前面提到的“基于主题”尤其如
  5. 此。另一方面,被研究文献的选取以及对结果的解释上仍然存在着主观偏见,对同 一问题的整合分析可以得出截然相反的结论。同时几乎所有作者及编辑都有更愿意 报道统计检验显著结果的趋向,所以综述者如果仅限于在发表物中综合独立研究结 果,有可能导致效应大小的高估。有人指出应当在搜集文献的过程中包含已发表的 和未发表的文章,但该建议在实践中难度巨大。 整合分析假定能够赋予原始综述数据不同的权重,让尽可能多的研究都为最 终结果作出贡献,但实际上我们都默认核心期刊的研究质量要好于其他期刊,而综 述对象最初的数据质量以及研究者的学术能力并不一致;整合分析要完全取代传统 的专家形式的文献回顾并不能跨越这一障碍。 当然量化是研究的主流也是结果得以客观的最重要途径,整合分析研究方法

    在实际操作中的实现难度并不悖于它在方法论上的优越性。很明显,为了从先前的 研究中获得最大的收获,正确的文献回顾策略应越来越普及和予以高度重视。 5 参考文献 van Hemert, D. A. (2003). Cross-cultural meta-analyses. In W. J. Lonner, D. L. Dinnel, S. A. Hayes, & D. N. Sattler (Eds.), Online Readings in Psychology and Culture (Unit 2, Chapter 13), (http://www.wwu.edu/~culture), Center for Cross-Cultural Research, Western Washington University, Bellingham, Washington USA F.D. Richard, Charles F. Bond Jr., Juli J. Stokes-Zoota. One Hundred Years of Social Psychology Quantitatively Described. Review of General Psychology. 2003. Vol.7 (4) pp. 331-363. Roxanne M. Laczo, Paul R. Sackett, Philip Bobko, Jose´ M. Cortina. A Comment on Sampling Error in the Standardized Mean Difference With Unequal Sample Sizes: Avoiding Potential Errors in Meta-Analytic and Primary Research. Journal of Applied Psychology. 2005, Vol. 90, No. 4, 758–764 David A. Rosenthal, William T. Hoyt, James M. Ferrin, Susan Miller, Nicholas D. Cohen. Advanced Methods in Meta-Analytic Research: Applications and Implications for Rehabilitation Counseling Research. Rehabilitation Counseling Bulletin. 2006. Vol. 49(4):
  6. 234–246 张鑫, 李昌庆, 文善彩. Meta2analysis 研究方法述评. 昆明冶金高等专科学校 学报. 2006. Vol.

    22 No. 1: 64-68 吕嘉春, 施侣元. Meta-analysis 及其在流行病学中的应用. 中华流行病学杂志. 1994.12. Vol. 15(6): 363-367 徐勇勇. Meta 分析常见资料类型及统计分析方法. 中华预防医学杂志. 1994.9. Vol. 28(5): 303-307 孟维杰. 文化心理观:心理学观的检讨与重构. 内蒙古师范大学学报(哲学社 会科学版). 2007.9. Vol. 36(5): 26-30 宋晓东, 叶浩生. 本土心理学与多元文化论——在人类心理学理论前景中的 相遇. 徐州师范大学学报(哲学社会科学版). 2008.1. Vol. 34(1): 112-116