所有这些特征综合在一起,就很能说明问题——可借此创建一个理想的算法,对这家银行的整个客户数据库层层筛查,最终锁定数量相对较少的潜在恐怖分子群体。
这是一张很严密的网,但还可以拉得更紧。最终使这个算法表现出色的是最后一个特征,它赋予这个算法无与伦比的威力。基于国家安全的考虑,该银行要求我们不要公开该特征,我们就称之为X变量吧。
是什么使X变量如此特别呢?首先,它是一个行为特征,不是人口统计特征。各地反恐部门梦寐以求的是,能在某天变为一只苍蝇,趴在恐怖分子房间的墙上。如今,对算法略做调整(但意义重大)之后,X变量就让反恐部门的梦想成真了。与这种算法中其他许多特征不同的是,X变量测算的是客户群某种特定的银行业务活动的频率。普通人也会存在这种行为(并不罕见),只是频率较低;但是,在具备恐怖分子其他特征的群体中,出现这种行为的频率要高很多。
正是这个特征赋予了上述算法巨大的预测威力。用这个算法分析覆盖数百万银行客户资料的数据库,霍斯利能生成一个包括嫌疑极大的30个用户的名单。根据他较为保守的估计,在这30个嫌疑人名单中,至少有5人肯定参与了恐怖主义活动。从30个人中找出5个,还并不完美——因为这种算法漏掉了很多恐怖分子,而且错误地识别了不少无辜者——但是,这绝对要比从500495个人中确定495个人的情况好多了。
截至本书写作之时,这份30人名单已被霍斯利传给上司,随后又被其上司递交给相关部门。霍斯利的工作已经完成,现在该他们出场了。考虑到这个问题的性质,霍斯利可能永远无从确定他是否做得够好,读者朋友也更不太可能看到他成功与否的直接证据,因为并没有发生的恐怖主义袭击无法得到验证。
然而,或许在不久后的某一天,当你坐在英国的一家酒吧里,不经意地发现离自己近在咫尺的地方,坐着一个陌生人,平和朴实,沉默寡言。你和他喝了一杯,又喝了一杯,随后又喝了第三杯。这时,他开始说上几句了,几乎是局促不安地提到,最近他被授予了爵位,现在叫伊恩·霍斯利爵士。他不能随意谈及与他受封爵位有关的事迹,只能告诉你,这与防止公民社会免遭坏人破坏有关。听到他为社会做出巨大贡献,你为了深表感谢,又请他喝了一杯,随后又是几杯。最终,酒吧打烊关门,你们两人东倒西歪地晃出大门。之后,在他正要朝光线暗淡的小巷中走去的时候,你突然想到了一个微不足道的方式,可略微报答他所做的贡献。于是,你把他又拉了回来,招呼了一辆出租车,把他塞进车里。因为,请记住,朋友不会让朋友醉酒后步行。
【注释】
(www.daowen.com)
[1]“数据不足”一词也是费德创造的,从白细胞减少症(leucopenia)截取后缀而得。
[2]“数据计数偏低”是仿“白细胞计数偏低”(low white-blood-cell counts)而得。
[3]太字节是计算机存储容量的单位,1太字节相当于2的40次方字节。——译者注
[4]这里及本书其他地方提及的死亡率,都是参考年龄和其他症状做出一定调整的死亡率。
[5]SOB是son of bitch的缩略语,意思为“狗娘养的”之类,是主要针对男性的十分粗鲁的骂人语,而在文中,这一缩略语表示“气短”(short of breath)。——译者注
[6]伊恩·霍斯利为化名,不过本文所有相关内容均是真实的。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。