比较两个样本

我们已经看到了几个评估单个样本是否看起来像从指定随机模型中随机抽取的例子。 - 阿拉米达县的陪审团候选名单看起来像是从合格陪审员总体中随机抽取的样本吗? - 孟德尔种植的豌豆植物的颜色是否与他模型中指定的概率一致?

在所有这些案例中,都只有一个随机样本,我们试图判断它是如何生成的。但通常,数据科学家需要比较两个随机样本。例如,他们可能需要比较被随机分配到治疗组和对照组的患者的结果。或者,他们可能随机分配互联网用户接收两个不同版本的网站,然后比较这两个随机组的行为。

在本章中,我们将开发一种使用Python比较两个随机样本并回答关于它们之间相似性和差异性问题的方法。你会看到我们开发的方法具有多样化的应用。我们的例子来自医学、公共卫生,还有橄榄球!