随机化

避免混杂因素的一个绝佳方法是将个体随机分配到处理组和对照组，然后对被分配到处理组的人实施处理。随机化能保持两组之间除处理因素外的其他方面相似。

如果你能够将个体随机分配到处理组和对照组，那么你就是在进行一项随机对照实验，也称为随机对照试验（RCT）。有时，实验参与者的反应会受他们知道自己所在组别的影响。因此，你可能希望进行一项单皲实验，即参与者不知道自己属于处理组还是对照组。为了实现这一点，你需要给对照组提供一种安慰剂，即看起来与处理因素完全一样但实际上无效的物品。

随机对照实验长期以来一直是医学领域的金标准，例如在确定新药是否有效时。它们在经济学等其他领域也变得越来越常见。

例子：墨西哥的福利补助。在90年代的墨西哥村庄，贫困家庭的儿童常常无法入学。原因之一是年长的孩子可以出去工作，帮助支撑家庭。墨西哥财政部长官 Santiago Levy（圣地亚哥·莱维）着手研究福利项目能否提高入学率并改善健康情况。他在一组村庄中进行了随机对照试验，随机选取其中一些村庄接受一个名为 PROGRESA（墨西哥“进步”项目）的新福利项目。该项目向贫困家庭提供资金，条件是孩子们定期上学，并且家庭采取预防性医疗保健措施。相比小学，中学生的家庭能得到更多补贴，以弥补孩子们失去的工资收入；女生入学的补贴高于男生。剩余的村庄没有接受这一处理，作为对照组。由于随机化，不存在混杂因素，因此可以确立 PROGRESA 提高了入学率。对于男生，入学率从对照组的73%上升到 PROGRESA 组的77%。对于女生，增幅更大，从对照组的67%上升到 PROGRESA 组的接近75%。由于该实验的成功，墨西哥政府以 OPORTUNIDADES（“机遇”项目）的新名称继续支持该项目，作为对健康和受过良好教育人口的投资。

随机化的益处

用我们已建立的术语来说，John Snow 进行的是一项观察性研究，而非随机实验。但他称自己的研究为“壮举实验”，因为他写道：“不于三十万人……没有经过他们的选择，而且在大多数情况下，他们根本不知情就被分成了两组……”

类似 Snow 这样的研究有时被称为“自然实验”。但是，真正的随机化并不只是指处理组和对照组被“无法选择”地筛选出来。随机化必须很谨慎地进行，遵循概率论的法则。

随机化的方法可以简单到抛硬币，也可以相当复杂。但每一种随机化方法都由一系列精心定义的步骤组成，这些步骤使得概率可以用数学方法指定。这有两个重要的意义。

它允许我们从数学上考虑这样一种可能性：随机化可能产生彼此差异很大的处理组和对照组。
它允许我们对处理组和对照组之间的差异做出精确的数学描述。这又帮助我们就处理因素是否具有效果得出合理的结论。

What if you can't randomize?

在某些情况下，即使目标是调查因果关系，也可能无法进行随机对照实验。例如，假设你想研究怀孕期间饮酒的影响，然后随机将一些孕妇分配到你的“饮酒”组。当你给她们酒时，你不能指望她们配合。在这种情况下，你几乎完全只能进行观察性研究，而非实验。请警惕混杂因素。

在本课程中，你将学习如何进行和分析自己的随机实验。这涉及更多的细节，超出了本章所述的范围。目前，只需关注核心思想：要尝试确立因果关系，尽可能进行随机对照实验。如果你在进行观察性研究，你可能能够确立关联，但要确定因果关系将更困难。在基于观察性研究就因果关系做出结论之前，必须非常谨慎地对待混杂因素。