为什么需要数据科学
大多数重要的决策都是在信息不全、结果不确定的情况下做出的。然而,许多决策的不确定性程度可以因获得大规模数据集以及有效分析所需的计算工具而大幅降低。数据驱动决策已经深刻变革了众多行业,包括金融、广告、制造业和房地产。与此同时,广泛的学术学科也在迅速发展,将大规模数据分析纳入其理论和实践中。
学习数据科学使个人能够将这些技术应用于工作、科学探索和个人决策。批判性思维长期以来一直是严谨教育的标志,但批评在有数据支持时往往最为有效。对世界任何方面(无论是商业还是社会科学)的批判性分析都涉及归纳推理;结论很少能被完全证明,只能由现有证据支持。数据科学提供了对任何一组观测做出精确、可靠和定量论证的手段。在信息获取和计算能力空前便利的今天,如果缺乏有效的推断技术,对于可衡量的世界任何方面的批判性思考都将是不完整的。
世界上有太多未解答的问题和艰巨的挑战,不能将这种批判性推理留给少数专家。社会各界的受教育人士都可以培养数据推理能力。工具、技术和数据集都已就位;本书旨在让每个人都能够掌握它们。