为什么均值很重要

在本课程中,我们研究了几种不同的统计量,包括全变差距离、最大值、中位数以及均值。在对随机性做出明确的假设下,我们绘制了所有这些统计量的经验分布。有些统计量,如最大值和全变差距离,其分布明显偏向某一方向。但样本均值的经验分布几乎总是接近钟形,无论所研究的总体是什么。

如果一个随机样本的性质无论总体如何都成立,那么它就成为了一个强大的推断工具,因为我们很少对总体中的数据有很多了解。大随机样本均值的分布就属于这类性质。这就是为什么随机样本均值在数据科学中被广泛使用。

在本章中,我们将研究均值以及在仅对底层总体做出最少的假设的情况下,我们能对它们说些什么。我们将解决的问题包括: