序列

[In ]:

from datascience import *
path_data = '../../assets/data/'

值可以分组到集合中，这使得程序员能够组织这些值并用一个名称引用它们。通过将值分组在一起，我们可以编写一次性对多条数据执行计算的代码。

对多个值调用 make_array 函数会将它们放入一个数组中，这是一种序列集合。下面，我们将四个不同的温度收集到一个名为 highs 的数组中。这些分别是 1850 年、1900 年、1950 年和 2000 年前后几十年间全球陆地的估计日均高温（摄氏度），表示为相对于 1951 年至 1980 年平均绝对高温（14.48 度）的偏差。

[In ]:

baseline_high = 14.48
highs = make_array(baseline_high - 0.880, baseline_high - 0.093,
                   baseline_high + 0.105, baseline_high + 0.684)
highs

array([13.6  , 14.387, 14.585, 15.164])

集合允许我们通过一个名称将多个值传递给函数。例如，sum 函数计算集合中所有值的和，len 函数计算其长度（即我们放入的值的数量）。将两者结合使用，我们可以计算集合的平均值。

[In ]:

sum(highs)/len(highs)

14.434000000000001

日均高低温的完整图表如下所示。

日均高温平均值

标题为 “Global Land” 并标注 “Berkeley Earth Surface Temperature” 的图。x 轴标注了 1820 年至 2000 年的年份。y 轴为高温（摄氏度）。深蓝色线表示 12 个月移动平均线，红色线表示 10 年移动平均线，并带有 95% 的不确定性范围。蓝色线在红色线上下波动，但总体上跟随它。这些线在数据起始处最低，1940 年之前约为 13.5 到 14.5 度。从大约 1970 年开始，线趋于上升，从约 14.5 度增加到近 15.5 度。

日均低温平均值

标题为 “Global Land” 并标注 “Berkeley Earth Surface Temperature” 的图。x 轴标注了 1820 年至 2000 年的年份。y 轴为高温（摄氏度）。深蓝色线表示 12 个月移动平均线，红色线表示 10 年移动平均线，并带有 95% 的不确定性范围。这些线显示出波动性，但在约 1940 年之前保持在 3 度以下。1970 年之后的较新数据呈上升趋势，结束于约 4 度。