因果性与实验

“这些问题现在是,并且可能将永远是自然界中不可解的秘密。它们属于人类智力根本无法触及的那类问题。”—《伦敦时报》(The Times of London),1849年9月,有关霍乱如何感染和传播

死刑有威慑效应吗?巧克力对你有好处吗?什么引起了乳腺癌?

所有这些问题都试图将原因归属于某个结果。对数据进行谨慎的检查可以帮助揭示这类问题的答案。在本节中,你将学习确定因果关系时涉及的一些基本概念。

观察是良好科学的关键。观察性研究是指科学家根据他们观察到的、但未参与生成的数据得出结论的研究。在数据科学中,许多这类研究涉及对一组个体的观察,其中有一个被称为处理因素的感兴趣因子,以及在每个个体上测量的结果

最简单的想法是将个体视为人。在研究巧克力是否对健康有益的调查中,个体确实是人,处理因素是吃巧克力,结果可能是心脏病的度量指标。但观察性研究中的个体不一定是人。在研究死刑是否具有威慑效应的调查中,个体可以是美国的50个州。多州允许死刑的法律被视为处理因素,结果可以是该州的杀人率。

核心问题是处理因素是否对结果产生影响。处理因素与结果之间的任何关系都被称为关联。如果处理因素导致结果的发生,那么这种关联就是因果的因果性是本节开头提出的所有三个问题的核心。例如,其中一个问题是巧克力是否直接导致健康状况的改善,而不只是巧克力与健康之间是否存在关系。

确定因果关系往往分两个阶段进行。首先,观察到一种关联。然后,更谨慎的分析引出关于因果关系的结论。