在科学的疗效试验中获取足够大的样本量

有时候对疗效的评价可能仅从一到两个中心的研究中就能获得足够的样本量。但在研究治疗对类似死亡等罕见结局的效果时,就需要多中心、甚至多个国家的患者参与研究,以获得可靠的证据。

例如,一个由13个国家10000名患者参与的试验显示,类固醇药物的使用会对严重脑损伤的患者起到致死性作用,而这种治疗已经被沿用了30多年。 [2]这个研究小组所做的另一项由40个国家20000名患者参与的试验显示,一种叫做氨甲环酸的廉价药物可以减少因损伤后出血而引起的死亡。 [3]

这些研究通过精心的设计来降低偶然因素所引起的偏倚和不确定性,它们是典型的科学试验,它们还为全球卫生保健提供了高度相关的高质量证据。事实上,在一项由英国医学杂志(BMJ)发起的民意调查中,上述氨甲环酸的随机对照试验被评选为2010年最重要的研究。

Effects of tranexamic acid on death among trauma patients with significant haemorrhage, overall and by continent of participants

各地区氨甲环酸对严重出血引起创伤患者死亡的情况及总体情况

尽可能将疗效的评估建立在充分信息基础之上是非常重要的,下面的图表是通过上述获奖团队友情提供的数据,来说明如何降低由偶然因素导致的风险。

图表底部的菱形方块代表了合并全部氨甲环酸试验后的结果。它表明这种药将出血引起的死亡数降低了近30%(风险率刚刚超过0.7)。

合并后的结果提供了对这种药物效果最可靠的评估,尽管“ A地区”各中心的评估显示出这种药物的效果不太显著(无统计学意义,有可能低估药物的真实疗效),但“其他地区”里各中心的结果显示出相当显著的效果(有可能高估了疗效)。

某种程度上,通过合并多个国家、多个中心的试验数据,可以减小偶然误差。这些相似但又相互独立的试验其结果有时可通过统计学方法进行合并——这一过程被称为“ Meta分析 ”。

尽管Meta分析的方法学已经被统计学家发展了多年,但直到20世纪70年代它才真正得以广泛应用,最开始是美国的社会学家,紧接着是医学研究者。截至20世纪末,Meta分析已作为科学试验重要的元素被广泛接受。

例如,在五个不同国家中,有五项被不同组织实施及不同资金支持的研究都在解决一个60年来未能解答的老问题:对于早产儿,“什么样的血氧水平最有可能保证他们幸免于重大残疾?”

如果血氧水平太高,婴儿可能会失明;如果太低,他们可能会面临死亡或脑瘫。对于这些体弱的婴儿,不同的血氧含量所造成的差异很可能不显著,所以这就更需要足够的样本量来探究差异。

因此这五个研究小组同意将自己负责的研究结果进行合并,这样所提供的结果将比任何一项单独研究所提供的都要可靠。 [4]