评估模型

在数据科学中，“模型”是一组关于数据的假设。通常，模型包含关于用于生成数据的随机过程的假设。

有时，数据科学家需要判断一个模型是否合理。本节将讨论一个做出此类决策的示例。

[In ]:

from datascience import *
%matplotlib inline
path_data = '../../../../assets/data/'
import matplotlib.pyplot as plots
plots.style.use('fivethirtyeight')
import numpy as np

陪审团遴选

数据科学是揭露社会中种族主义和不平等的有力工具。本节讨论的是一个数据为陪审团遴选中的种族偏见提供证据的案例。

美国宪法第六修正案规定：“在所有刑事起诉中，被告应享有由犯罪发生地所在州和地区的公正陪审团迅速公开审判的权利。”

“公正”陪审团的一个特征是，它应从代表相关地区人口的陪审团候选名单中遴选产生。陪审团候选名单是一组被选为潜在陪审员的人员。最终的审判陪审团通过有意纳入或排除的方式从中遴选，因此可以有任何组成。但从中抽取审判陪审员的更大候选名单必须代表人口结构。

陪审团候选名单是否真正代表地区人口，这一问题具有重要的法律意义。如果人口中的某个群体在陪审团候选名单中系统性代表不足，就可能引发关于陪审团是否公正，以及被告是否获得正当程序的质疑。

这正是罗伯特·斯温（Robert Swain）案中最高法院面临的问题。斯温是一名黑人男性，1962年在阿拉巴马州塔拉迪加县被定罪。他以黑人在塔拉迪加县被系统性排除在陪审团之外为由，一路上诉至美国最高法院。最高法院驳回了他的上诉，罗伯特·斯温随后被判处终身监禁。

然而，我们下面的分析表明，数据与最高法院得出的结论并不一致。相反，数据指向了陪审团遴选过程中的偏见。刑事司法系统中的这种偏见反映了当时普遍存在的针对黑人的歧视和不公正。

我们首先查看数...（内容已截断）

随机选择模型

对数据的一种看法——换言之，一种模型——是：陪审团候选名单是随机选择的，最终只有少数黑人候选陪审员纯粹是因为随机性。

由于候选名单应反映所有合格陪审员的人口结构，评估随机选择模型十分重要。让我们看看它是否能经得起检验。

该模型详细说明了一个随机过程。它认为数据如同从一个26%人口为黑人的总体中随机抽取的样本。我们之所以能够评估该模型，原因如下：

我们可以基于模型模拟数据。也就是说，我们可以模拟从一个26%为黑人的总体中随机抽取。
我们的模拟将展示如果候选名单是随机选择的，它会是什么样子。
然后我们可以将模拟结果与实际陪审团候选名单的构成进行比较。
如果我们的模拟结果与审判中候选名单的构成不一致，那就构成了反对随机选择模型的证据。因此，这也将成为反对审判公正性的证据。

让我们逐步进行这个过程。

统计量

首先，我们需要选择一个统计量进行模拟。该统计量必须能够帮助我们决定是支持该模型还是关于数据的其他观点。模型认为候选名单是从合格人群中随机抽取的。另一种观点是罗伯特·斯温的主张，即候选名单中黑人候选陪审员太少，不可能是随机抽取的。因此，一个自然的统计量就是样本中黑人候选陪审员的数量或“计数”。较小的统计量值将支持罗伯特·斯温的观点。

在模型下模拟统计量

如果模型成立，统计量通常会有多大？为了回答这个问题，我们将在随机选择的假设下模拟该统计量，并观察其分布...（内容已截断）

[In ]:

sample_size = 100
eligible_population = [0.26, 0.74]

sample_proportions 输出数组中的类别顺序与输入数组一致。因此随机样本中黑人候选陪审员的比例为输出数组的 item(0)。多次运行下方单元格，观察随机选择的候选名单中黑人陪审员样本比例的变化。你看到有低至0.08的值吗？

[In ]:

sample_proportions(sample_size, eligible_population).item(0)

0.27

每个类别中的计数等于样本量乘以相应比例。因此我们可以同样方便地模拟计数而非比例。

让我们定义一个实现此功能的函数。该函数将随机抽取一个候选名单，并返回其中黑人候选陪审员的人数。

[In ]:

def one_simulated_count():
    return sample_size * sample_proportions(sample_size, eligible_population).item(0)

模拟统计量的多个值

我们分析的重点是计数的变异性。让我们生成10,000个模拟计数值，观察它们如何变化。与往常一样，我们将使用 for 循环并将所有模拟计数收集到一个数组中。

[In ]:

counts = make_array()
repetitions = 10000
for i in np.arange(repetitions):
    counts = np.append(counts, one_simulated_count())

随机选择模型下的预测

为了解释模拟结果，我们可以用模拟计数的经验直方图来可视化结果。

[In ]:

Table().with_column(
    'Count in a Random Sample', counts
).hist(bins = np.arange(5.5, 46.6, 1))

Histogram with 'Count in a Random Sample' on the x-axis and 'Percent per unit' on the y-axis. The data is centered below 30 and has a bell shape that extends from approx 15 to 40.

直方图展示了随机选择模型对我们统计量（样本中黑人候选陪审员人数）的预测。

为生成每个模拟计数，我们从26%为黑人的总体中随机抽取了100次。因此，正如你所料，大多数模拟计数在26左右。它们并非恰好为26：存在一定的变异。计数范围大约从15到40。

比较预测与数据

在审判所选出的候选名单中，有八位黑人候选陪审员。下方重新绘制了模拟计数的直方图，数值8以红点显示在横轴上。该红点位于直方图左尾很远的位置。在随机选择的10,000次模拟计数中，极少有结果达到8或更少。

[In ]:

Table().with_column(
    'Count in a Random Sample', counts
).hist(bins = np.arange(5.5, 46.6, 1))
plots.ylim(-0.002, 0.09)
plots.scatter(8, 0, color='red', s=30);

Histogram with 'Count in a Random Sample' on the x-axis and 'Percent per unit' on the y-axis. The data is the same as in the previous histogram, bell shaped and centered around 26. A red dot has been added at x=8 and does not overlap with any of the bars of the histogram.

数据分析的结论

上图直观展示了遴选过程中的偏见。它表明，如果我们从合格人群中随机选择一个规模为100的候选名单，得到像审判中观察到的那样仅有八位黑人候选陪审员的可能性极低。

这是反对陪审团候选名单中陪审员随机选择模型的证据。虽然候选名单“有可能”是由随机性产生的，但我们的模拟表明这种可能性极低。

审判候选名单的现实情况与模型关于从合格人群中随机选择的假设严重不符。当数据与模型不一致时，模型很难被 justification。毕竟，数据是真实的，而模型只是一组假设。当假设与现实相悖时，我们必须质疑这些假设。

因此，最合理的结论是：对于该陪审团候选名单，随机选择的假设是不成立的。换言之，最合理的结论是：该陪审团候选名单“并非”通过从合格陪审员总体中随机抽样选出。尽管最高法院持有不同意见，但26%与8%之间的差异并非小到可以用随机性单独解释。

统计偏差

上述分析为罗伯特·斯温审判中的不公正提供了量化证据。数据支持他的立场，即他被剥夺了美国宪法赋予他的公正陪审团的权利。

更多数据显示，排斥黑人候选陪审员的现象普遍存在。最高法院1965年的判决书中包含了罗伯特·斯温提供的证据：“自1953年以来，从陪审员抽签箱中抽取的陪审团候选名单中仅有10%至15%为黑人，只有一例比例高达23%。”观察一下10%和15%在上方直方图横轴上的位置。这些数值在从合格人群中随机选择的情况下也是极不可能的。

当一个过程产生的误差系统性偏向某一方向时——例如黑人候选陪审员的比例总是低于预期——数据科学家称该过程存在“偏差”。量化这种偏差是数据科学的一项重要职责。

像本节这样的论证如今越来越多地在法庭上被提出。在20世纪60年代，最高法院审视了这些数据，但得出了错误的结论，认为“总体百分比差异很小”。对于“小”的含义，依赖法院多数派主观认为合理的方式来判定是错误的。对于何为合理的看法不仅是纯粹主观的，而且容易受到普遍存在的种族偏见的影响。如果该案中的论证包含了本节的量化分析，法院可能就不会得出百分比差异很小的结论了。

种族偏见

遴选过程中的统计偏差源于当时法律体系中根深蒂固的种族偏见。

例如，最高法院判决书指出，塔拉迪加县的陪审团候选名单是从陪审员名册中选出的，而陪审员名册是陪审团委员从“城市名录、登记名单、俱乐部和教会名单、与社区中白人和非白人的交谈，以及个人和商业熟人”中获取的。这一过程明显偏向于委员们的社会和职业圈内的人，对黑人存在偏见。这种将黑人系统性排除在陪审员名册之外的做法意味着极少数黑人能被选入陪审团候选名单。

即使候选名单中有黑人，他们通常也无法进入最终的陪审团。在罗伯特·斯温的陪审团候选名单中的八名黑人男性中，两人被免除，六人被控方通过一种称为“无因回避”（peremptory challenge）的程序排除。在这一程序中，双方律师可以不给出理由就排除或“剔除”一定数量的候选陪审员。

反对无因回避程序的不公平是罗伯特·斯温上诉的重要组成部分。他指出：“检察官一贯且系统性地行使剔除权，以阻止任何黑人候选陪审员进入陪审团本身。”法院承认，塔拉迪加县从未有任何民事或刑事案件中有过黑人陪审员，但仍然驳回了上诉。

法律体系中的种族偏见源于社会中的偏见。针对黑人的歧视和不公正长期普遍存在，以至于在社会许多方面几乎成了一种常规的思维和行为方式。作为社会成员，最高法院的大法官们也未能幸免。法院多数派将其判决呈现为最适当、最合乎逻辑的法律解释，但事实并非如此。...（内容已截断）

延伸阅读

罗伯特·斯温在美国最高法院的辩护律师是康斯坦斯·贝克·莫特利（Constance Baker Motley），她是第一位在该法院辩护案件的非洲裔美国女性。她在最高法院辩护了10个案件，仅输掉一宗——即1965年罗伯特·斯温的案件。

瑟古德·马歇尔（Thurgood Marshall）于1967年成为第一位非洲裔美国最高法院大法官，他研究了最高法院在罗伯特·斯温案中的判决，并推动废除仅基于种族的无因回避。这一目标在1986年最高法院案件巴特森诉肯塔基州案（Batson v. Kentucky）中得以实现。

但马歇尔对巴特森判决的有效性感到担忧。他预见到一些法律团队会通过寻找表面上种族中立的方式来规避该判决，从而继续排除黑人陪审员。在他与法院多数意见一致的附议意见中，他建议更进一步，完全禁止无因回避。他的结语是：“我赞同法院关于种族歧视性地使用无因回避违反平等保护条款的裁决，我加入法院的意见。然而，只有完全禁止无因回避才能结束这种歧视。”瑟古德·马歇尔的担忧具有先见之明，你将在下面的阅读材料中看到这一点。

2013年，康斯坦斯·贝克·莫特利被追授国会金质奖章，以表彰她“对美国的持久贡献和服务”。众议院议员在支持该奖项时写道：“康斯坦斯·贝克·莫特利在美国最高法院唯一一次败诉是在Swain诉Alabama案（380 U.S. 202, 1965）中，在该案中，法院拒绝禁止种族歧...（内容已截断）