序列

[In ]:
from datascience import *
path_data = '../../assets/data/'

值可以分组到集合中,这使得程序员能够组织这些值并用一个名称引用它们。通过将值分组在一起,我们可以编写一次性对多条数据执行计算的代码。

对多个值调用 make_array 函数会将它们放入一个数组中,这是一种序列集合。下面,我们将四个不同的温度收集到一个名为 highs 的数组中。这些分别是 1850 年、1900 年、1950 年和 2000 年前后几十年间全球陆地的估计日均高温(摄氏度),表示为相对于 1951 年至 1980 年平均绝对高温(14.48 度)的偏差。

[In ]:
baseline_high = 14.48
highs = make_array(baseline_high - 0.880, baseline_high - 0.093,
                   baseline_high + 0.105, baseline_high + 0.684)
highs
array([13.6  , 14.387, 14.585, 15.164])

集合允许我们通过一个名称将多个值传递给函数。例如,sum 函数计算集合中所有值的和,len 函数计算其长度(即我们放入的值的数量)。将两者结合使用,我们可以计算集合的平均值。

[In ]:
sum(highs)/len(highs)
14.434000000000001

日均高低温的完整图表如下所示。

日均高温平均值

标题为 “Global Land” 并标注 “Berkeley Earth Surface Temperature” 的图。x 轴标注了 1820 年至 2000 年的年份。y 轴为高温(摄氏度)。深蓝色线表示 12 个月移动平均线,红色线表示 10 年移动平均线,并带有 95% 的不确定性范围。蓝色线在红色线上下波动,但总体上跟随它。这些线在数据起始处最低,1940 年之前约为 13.5 到 14.5 度。从大约 1970 年开始,线趋于上升,从约 14.5 度增加到近 15.5 度。

日均低温平均值

标题为 “Global Land” 并标注 “Berkeley Earth Surface Temperature” 的图。x 轴标注了 1820 年至 2000 年的年份。y 轴为高温(摄氏度)。深蓝色线表示 12 个月移动平均线,红色线表示 10 年移动平均线,并带有 95% 的不确定性范围。这些线显示出波动性,但在约 1940 年之前保持在 3 度以下。1970 年之后的较新数据呈上升趋势,结束于约 4 度。