论文首页哲学论文经济论文法学论文教育论文文学论文历史论文理学论文工学论文医学论文管理论文艺术论文 |
单个研究的局限性
单个研究常常既不能发现也不能排除两种疗法较小的但与临床有关的的差异。一个试验可能显示无显著疗效,然而事实上疗效确实存在,因而可能产生假阴性结果。这是一种II型误差,对某一治疗效果、样本大小和显著意义水平的差异,这种误差的出现的概率可能被计算出。通常I型误差较好识别——当一个试验随机产生显著差异时,这种误差的概率反映在P值。一个对报道在试验组和对照组之间治疗无显著差异的临床试验的调查显示,在临床研究中出现II型误差相当普遍:对一个临床疗效的差异,在被检查的总数为136个的115个试验中遗漏这一作用的先验概率(在某一样本大小)超过20%。临床试验中所包含的病人数常常不够充分,这种情况在新近的几年中几乎没有改变。在某些情况下,那些必须的样本大小仍然很难达到。例如有一种药物,它能使心肌梗塞的致死风险减少10%,而仅在英国每年就可以延长成千上万病人的生命。要想测出这种药物效应并具有90%的确定性(要求II型误差不得超过10%),那么一个治疗组就需1万多个病人。
为取代如此巨大而昂贵、逻辑解释又较困难的研究,荟萃分析看来是一个非常吸引人的选择。可利用几个较小的但具有可比性的评估相同的或类似的药物试验的数据。通过这种方法容易获得所需病人的数量,并可以按可信度发现或排除相对较小的药物效应。
同样,荟萃分析有助于估计研究结果的普遍性。某些具体研究的发现可能只有在与该研究人群具有相同特性的病人群体中才有效。如果在不同的病人群体的实验发现具有类似结果,那么可以得出结论这种干预的效果具有普遍性。通过集中所有可获得的数据,荟萃分析比单个试验能更好地回答关于一个总体研究结果是否在各个亚群中(如男性病人、女性病人或疾病的严重程度不同的对象)存在差异。随着这一系列文章的讨论的展开,这些问题将加以阐明和分析,往往可