随机化

避免混杂因素的一个绝佳方法是将个体随机分配到处理组和对照组,然后对被分配到处理组的人实施处理。随机化能保持两组之间除处理因素外的其他方面相似。

如果你能够将个体随机分配到处理组和对照组,那么你就是在进行一项随机对照实验,也称为随机对照试验(RCT)。有时,实验参与者的反应会受他们知道自己所在组别的影响。因此,你可能希望进行一项单皲实验,即参与者不知道自己属于处理组还是对照组。为了实现这一点,你需要给对照组提供一种安慰剂,即看起来与处理因素完全一样但实际上无效的物品。

随机对照实验长期以来一直是医学领域的金标准,例如在确定新药是否有效时。它们在经济学等其他领域也变得越来越常见。

例子:墨西哥的福利补助。在90年代的墨西哥村庄,贫困家庭的儿童常常无法入学。原因之一是年长的孩子可以出去工作,帮助支撑家庭。墨西哥财政部长官 Santiago Levy(圣地亚哥·莱维)着手研究福利项目能否提高入学率并改善健康情况。他在一组村庄中进行了随机对照试验,随机选取其中一些村庄接受一个名为 PROGRESA(墨西哥“进步”项目)的新福利项目。该项目向贫困家庭提供资金,条件是孩子们定期上学,并且家庭采取预防性医疗保健措施。相比小学,中学生的家庭能得到更多补贴,以弥补孩子们失去的工资收入;女生入学的补贴高于男生。剩余的村庄没有接受这一处理,作为对照组。由于随机化,不存在混杂因素,因此可以确立 PROGRESA 提高了入学率。对于男生,入学率从对照组的73%上升到 PROGRESA 组的77%。对于女生,增幅更大,从对照组的67%上升到 PROGRESA 组的接近75%。由于该实验的成功,墨西哥政府以 OPORTUNIDADES(“机遇”项目)的新名称继续支持该项目,作为对健康和受过良好教育人口的投资。

随机化的益处

用我们已建立的术语来说,John Snow 进行的是一项观察性研究,而非随机实验。但他称自己的研究为“壮举实验”,因为他写道:“不于三十万人……没有经过他们的选择,而且在大多数情况下,他们根本不知情就被分成了两组……”

类似 Snow 这样的研究有时被称为“自然实验”。但是,真正的随机化并不只是指处理组和对照组被“无法选择”地筛选出来。随机化必须很谨慎地进行,遵循概率论的法则。

随机化的方法可以简单到抛硬币,也可以相当复杂。但每一种随机化方法都由一系列精心定义的步骤组成,这些步骤使得概率可以用数学方法指定。这有两个重要的意义。

  1. 它允许我们从数学上考虑这样一种可能性:随机化可能产生彼此差异很大的处理组和对照组。

  2. 它允许我们对处理组和对照组之间的差异做出精确的数学描述。这又帮助我们就处理因素是否具有效果得出合理的结论。

What if you can't randomize?

在某些情况下,即使目标是调查因果关系,也可能无法进行随机对照实验。例如,假设你想研究怀孕期间饮酒的影响,然后随机将一些孕妇分配到你的“饮酒”组。当你给她们酒时,你不能指望她们配合。在这种情况下,你几乎完全只能进行观察性研究,而非实验。请警惕混杂因素。

在本课程中,你将学习如何进行和分析自己的随机实验。这涉及更多的细节,超出了本章所述的范围。目前,只需关注核心思想:要尝试确立因果关系,尽可能进行随机对照实验。如果你在进行观察性研究,你可能能够确立关联,但要确定因果关系将更困难。在基于观察性研究就因果关系做出结论之前,必须非常谨慎地对待混杂因素。