特写:一个让连环杀手畏惧的算法

By 黄小天2017年2月17日 10:14

2010年8月18日,美国印第安那州加里地区( Gary)的一名警督收到一封电子邮件,邮件标题不禁让人想起大卫·芬奇电影中的画面:

“加里地区活跃着连环杀手吗?”


这名警督不清楚如何处理这封邮件,即使把它当做一出恶作剧而丢弃也可理解。但是写信的人异常严肃,信中的附件是 FBI 的电子表格,记录着近年来加里地区14起未破解的谋杀案,死者的年龄在20至50岁之间。每个谋杀案的死因是一样的:窒息。他写道,和全国的统计数据相比,加里地区相似谋杀案的数量远高于平均值。同一地区的14个人死于同一原因,不是表明他们的一些也许更多有联系?也许凶手还在逍遥法外?


这位警督没有回应。十二天后,警察局长 Gary Carter 收到了第二封邮件。里面添加了一些详细信息。有几名女受害人在家中被勒死;在至少两起案件中,谋杀后有纵火;在最近的案件中,几名妇女被勒死在遗弃的建筑物内或周围。写信的人质问,以上至少应该有个说法吧?


加里警察局没有回复邮件,同样也没回复挂号寄出的两封后续邮件。关于邮件和谋杀案,警察局里没有一个人对此做公开评论。写邮件的人叫 Thomas Hargrove,一名来自弗吉尼亚州的61岁退休新闻记者,他说:“这是我职业生涯里最为沮丧的一次经历。”


800x-1.jpg

谋杀问责项目(Murder Accountability Project)网站上的数据;照片由Cait Oppermann为彭博商业周刊拍摄


Hargrove 一生都是一个数据控。早年在密苏里大学读新闻专业时,他第一次分析了政治选票数据集,成为了大学投票组织的学生负责人。 毕业后他加入了斯克里普斯大学报社(E.W. Scripps newspaper),从政治选票到任一现实主题,他都可以做数据统计分析。他回忆道: “在新闻编辑部,同事们会说,交给 Hargrove,这是一个数字问题。”


2004年,Hargrove 的编辑要求他调查卖淫的统计数据。 进行调查的唯一方法是获得美国最全面的犯罪统计资料库--联邦调查局统一犯罪报告(the FBI’s Uniform Crime Report)或 UCR 的副本。 当 Hargrove 从密苏里大学数据库索取报告的副本时,里面附带的是他没有想到的东西:补充性谋杀报告(the Supplementary Homicide Report)。 “我打开它,这是我从来没有见过的一个纪录,”他说, “一行一行,每一次谋杀都被报告给联邦调查局。”


这份涵盖2002年情况的报告包括大约16,000起谋杀案,每一起谋杀案包括以下类目:受害者的年龄、种族、性别以及杀害方式分列,提出报告的警察局,对案件已知的情况,关于罪犯的信息以及罪犯是否被知道。Hargrove 说,第一次看到这份报告时,就在内心升起了不知来自哪里的想法:也许教会一台电脑发现连环杀手是可能的?


像很多人一样,Hargrove 意识到了警察在调查困难案件时,碍于隧道视觉(unnel vision)(隧道视觉现象,是指对特定的对象投入了太多的注意资源而无暇顾及到其他参照系统。——编译注)而遭受的批评。 他听说过“连锁盲点”(“linkage blindness”),该术语用来描述这一倾向——执法辖区没有将正好发生在县或州之间类似案件中的疑点关联起来。Hargrove认为,报告里的某些部分,可以解决“连锁失明”的问题。 正确的人以正确的方式观察信息就能够识别任何一个逍遥法外的连环杀手。


他每年都下载并压缩最新的数据集。 真正令他震惊的是从未破案的谋杀案件数量。(在法律实施中,当嫌疑人被捕时,无论最终结果如何,案子就算破了。)Hargrove 统计了211487个未破案件,其中,超过三分之一的杀人案发生在1980至2010年之间。他很诧异, 为什么公众没有激烈反对这么大量的未破案件的存在?


更糟糕的是,Hargrove 发现,尽管刑侦科学(the science of crime fighting)中有一代人努力下创新,包括DNA分析,但是,破案率不但没有增加,反而在下降甚至是暴跌。 60年代的平均案件清除率接近90%; 2010年之前一直与60年代中期持平,2010年之后又急剧下降中。


600x-1.png

这些令人不安的趋势促使 Hargrove 给加里警察局写了信,却杳无音讯。 果然,四年后,2014年10月,印第安纳州哈蒙德——加里警察局的邻镇——一个6号汽车旅馆的房间里发现了19岁岁女孩 Afrikka Hardy 的尸体。通过 Hardy 的电话记录, 警察追踪到一名嫌疑犯——43岁的Darren Deon Vann。 被捕之后,Vann 将警察带到了被遗弃的建筑物,在那里他藏着另外六个尸体,他们生前都生活在加里及其周边地区:Anith Jones 直到10月8号还活着; Tracy Martin 在6月失踪; Kristine Williams 和 Sonya Billingsley 在2月消失; Teaira Batey 和 Tanya Gatlin 在1月消失。


在援引他保持沉默的权利之前,Vann 不顾一切地提到自1990年代以来他一直在杀人。为了给 Scripps 做报道,Hargrove 去了加里,并调查他在2010年被认定给 Vann 案例是不是 Vann 干的。 他记得只有一个有用的回应,湖县的一个助理验尸官答应跟进,却也无果而终。 现在,由于通过法院的方式对 Vann 进行起诉,所有参与案件的人收到一个禁言令,防止公开猜测2010年Hargrove 指出的任何受害者是否也可能也是 Vann 杀害。 “至少有七个女人死了,自从我试图向加里警察局证明连环杀手的存在,”Hargrove 说。 “这是一个相当坏的杀人犯。”


Hargrove 也关注其他可能的杀手。他认为: “还有很多未被抓捕的连环杀手,几乎每一个城市里至少有几个连环杀手。”


我们正处在这样一个时刻,在全国犯罪率下降了几十年之后,谋杀率却已开始在美国许多主要城市上升起来。 两年来,主要城市的杀人案件超过平均值10个百分点。 (这些趋势并不一致,例如,芝加哥从2015年的485个报告的杀人事件猛增到2016年的762个,而纽约和巴尔的摩的谋杀数量在下降。)总统特朗普在竞选活动中发誓,一个法律和秩序新时代将会到来,尤其要避免推特上的芝加哥“大屠杀”再次发生。


除了联邦干预的威胁之外,如果没有首先解决破案率,很难解决高谋杀率的问题。 因此,我们生活在这样一个时代也许是偶然的,在这个时代里,数据分析应该帮助我们破译、检测和预判一切事情,从总统选举结果到棒球运动员表现。 迈克尔·刘易斯的“点石成金”(Moneyball)为许多人带来了以数据为中心的解决问题的方法,这种方法将棒球大联盟(Major Leaguers )的统计评估方法介绍给了作为棒球小白的大众,并成就棒球英雄 Billy Beane ——奥克兰运动家队主席。执法领域似乎是数据的用武之地:在20世纪90年代,纽约警察局闻名于利用数据更有效地把警员派遣到犯罪现场,其使用的 CompStat 系统成为了全美警察局的标杆。


Hargrove 成功做到的远不止以上这些。 他最大的创新在于使用以前从未被使用过的(包括任何一名执法人员也没使用过)公开易得的信息,帮助电脑去发现逍遥法外的谋杀犯。在某种意义上讲,这使他的成就超过了 Billy Beane。他的工作为那些悬置已久的问题带来曙光:为什么警察在解决谋杀的问题上毫无进步,任由杀人犯逍遥法外,我们怎么能期望犯罪率降低呢?


800x-1 (1).jpg

Hargrove 在弗吉尼亚州亚历山大的家庭办公室;照片由Cait Oppermann为彭博商业周刊拍摄


几年之后,Scripps 报社的编辑才同意给 Hargrove 足够的时间研究联邦调查局的杀人数据。 在一名密苏里大学研究生的帮助下,Hargrove 在2008年首次将杀人报告转化为统计软件。他花了几个月时间尝试开发一种算法,用于识别具有足够共性指向同一凶手的未破案例。 最终,他决定通过把其想法应用于一个著名案例来反向工程其算法,这个案例的凶手是被称为绿河杀手的 Gary Ridgway,他承认过去的20年里在西雅图地区杀害了48名女人。Hargrove 认为,如果他能设计一个发现绿河杀手的受害人的算法,他就已经走上了正轨。


“我们进行了一百次无效的尝试。”他回忆说。 最后,他选定了用于聚类分析的4个特征:地理、性别、年龄组和杀害方式。性别方面他选择了女性,因为大多数的多凶手案件的受害人是女人,这些女人生前并没有与团伙组织有关联。当他使用连环杀手最常下手的目标人群——20至50岁之间的女性——的数据时,算法就像老虎机一样亮闪闪地运转起来。他说:“很明显这个算法有效,事实上,是非常有效。”


绿河杀手马上出现在这个算法里。 这是个好消息。 Hargrove 的算法在洛杉矶找出了77未归案的凶手,并认为这其中有警察正在追击的凶手,包括所谓的南边杀手(Southside Slayer),以及最近的无情睡眠者(Grim Sleeper)。算法同样找到了凤凰城里64个未归案的女凶手。


然后还有第二组可能没有被当地警察辨别出的连环杀手。 “算法的整个要点是找到最易获得的成果,最明显的簇,” Hargrove说。 “但是,全国这样的簇有几十个。”


在2015年,Scripps 公司剥离了报社业务,Hargrove 和其他印刷记者失去了工作。他是离开报社后唯一不糟糕的情况是,当时他59岁,在公司工作了37年,有资格获得大量遣散费和高额退休金,足以使他生活无忧。 现在他有足够的时间去完成其数据项目。 他创立了谋杀问责项目( Murder Accountability Project),简称 MAP,一个旨在更好帮助传播和获取 FBI 谋杀数据微型非营利组织。


应信息自由法案(FOIA)的要求,MAP 试图追踪众多市县由于官员懒惰、人力匮乏或仅仅因为不称职(rank incompetence)而未向 FBI 备案的谋杀数据。MAP 已汇总了从1980年至2014年638,454起凶杀案件的案件详情,包括尚未向 FBI 报告的23,219起案件。这是覆盖全美国谋杀类案件详细信息的最完整清单,而这些网站已经完全开放。任何拥有统计分析软件的人都可以在网上免费查阅,并寻找跨管辖区的连环杀手;也都可以将已定罪杀手的时间轴与未解决的谋杀案件的时间点进行比较,以确定其中的连接是否合理。Hargrove 说:「如果你在家乡发现了可疑的情况,试着回忆并查看吧。如果你的女儿被谋杀,可以调用她的记录来查看是否可能有其他匹配的记录。我们希望能够借助群体的力量抓捕凶手。」


警方从不善于利用统计的力量。警察文化通常是纸质的、分散的与孤立的,且其部门不轻易接受技术创新。国家犯罪信息中心(NCIC)数据库允许警方获取诸如逃犯证件、被盗财产和失踪人员等信息,但无法搜索未解决的杀人事件。疾病控制和预防中心的国家暴力死亡报告系统汇编了32个州受害者的死亡证书信息,但同样不能搜索没破的案件。一些州拥有自己的杀人数据库,但无法看到来自其他州的数据,所以连锁盲点仍然存在。


FBI 在20世纪90年代创建了另一个自愿报告数据库,它专用于暴力和性犯罪,称为「暴力罪犯逮捕计划」(the Violent Criminal Apprehension Program)或 ViCAP。但主要由于它的自愿性,所以很容易被警察部门忽视,因而收效甚微。执行了三年该计划的 Gregory Cooper 说:「令人沮丧的是,大多执法机构并未真正了解 ViCAP 的目的;就像我有一辆车,但却没有人给它加油一样」。Hargrove 称 ViCAP 为「一个从未被适当资助的实验,而且大多警察部门都没有从真正意义上采纳它」。


这些都会增加或至少未能减弱统一犯罪报告及其补充性凶杀报告的趋势。Hargrove 的数据分析表明,破案率与数十年前相比仍旧很低;其从2014年的64.5%下降到2015年的61.5%,意味着2015年有6,043起谋杀案没有破。他筛选了这些调查结果,并得知大城市的破案率往往低于小城镇,而由于这种大型案件在人口较少的地区更罕见,因而往往更受关注。(这可能部分解释了加拿大每年有500到600起凶杀案有75%未破的原因。)


Hargrove 还得知,涉及到谋杀时,并非所有的大城市都相同。他说:「差异非常惊人」。洛杉矶、纽约和休斯顿都远高于70年代中期很低的平均破案率;而新奥尔良、底特律和圣路易斯最低,甚至能和40年代中期相提并论。


600x-1 (1).png

谋杀率居高不下的大城市的警方指责杀人案件与帮派与毒品有关,而且证人不愿站出来指证凶手。“最大的问题是大家彼此都认识。”宾夕法尼亚州切斯特(切斯特的凶杀率超过美国所有其他城市 ,是费城附近地区的两倍多)的警察局长 Darren Alston 这样告诉费城日报( Philadelphia Daily News)。同样,当地居民也对警察缺乏信任。但是,另一个更明显的问题是资源。Hargrove 说:“我们像资助教育一样资助凶案调查——由地方税来承担。当一个地方的经济开始下滑时,我们就不得不开始裁员警察,一切变得就像我们看到的那般糟了。”


MAP 也跟踪其网站上的警员配置趋势。 Hargrove 指出,密歇根州的弗林特和俄亥俄州的代顿自1990年代以来的破案率下降超过30%,与此同时,警察人员数量大幅减少(弗林特为330至185人,代顿为500至394人)。 当 Hargrove 的团体提交了一份政府信息公开请求,以获得底特律一个可疑连环杀手的杀人数据时,得到的回答是警局缺乏预算来满足该请求。 Hargrove说:“当一个城市说‘我们太拮据了,连保存记录都做不到’,对此你能做些什么?” 我开玩笑说,“我们现在所做的事情,就像打造了一款识别政府失职的探测器。”


不过,有一种观点认为,破案率不仅仅是警察部门人员配置的函数。 优先事项和管理也很重要。2000年,马里兰大学的犯罪学家 Charles Wellford 发表了一篇重要论文,找出了高效破案部门的共同点。 第一个共同点就是确保警察能够在案件发生后几个小时内这一关键时期,跟踪犯罪线索,即使这意味要支付加班费。 目前,Wellford 的研究关注的是每个警官花费的金额,每个案例花费的金额以及侦探所占警员的百分比。Wellford说:“破案率在很大程度上取决于优先事项和资源。 我不仅仅认为这是一个开放问题。 对我来说,现在问题是:如何利用部门所拥有的资源改善严重犯罪的破案工作?


自成立 MAP 以来 Hargrove 遇到的最令人沮丧的事情是,很多警察局不仅忽视 FBI 的数据,还根本懒得将他们的数据共享给 FBI。MAP 因为要求信息公开而起诉的伊利诺伊州就是其中一例。Hargrove 最近报告说,2015年,较之其他州,伊利诺伊州凶杀案更无望破案。756个凶案,破案率仅37.3%。就在总统和其他人士开始寻求解决方案时,如此之低破案率似乎间接解释了芝加哥不断攀升的谋杀率。


从和加里警局打交道的经验中,Hargrove 有了关于数据的第一个大教训:如果是一个坏消息,并不是所有人都愿看到数字。不久前,他开始来硬的。他和 MAP 副主席 Eric Witzig(一个和 ViCAP 共事过的 FBI 退休探员)在国际凶杀案调查员协会(International Homicide Investigators Association )的会议以及FBI 培训部,开展了培训课程。在房间里,Hargrove 使用 JonBenét Ramsey 案例作为对数据库的测试,成功地引起了探员的注意。探员们看着他在州上选择了“科罗拉多”,武器上选择了“勒死”,受害者性别选择了“女性”,年龄选择了“6”岁。在科罗拉多出现了唯一一个案例——JonBenét。但是,随着 Hargrove把标准扩宽为5至10岁的女孩子,科罗拉多出现了第二个案例——Melanie Sturm,一个1985年发现被勒死于Colorado Springs的10岁女孩。接着,Hargrove 把检索范围扩展至全国,发现了27个未破案例,其中11个发生在西部州。他向探员展示了将此信息下载到列表中有多么容易。这和 CSI 很像。FBI 国际刑事调查分析协会(FBI’s International Criminal Investigative Analysis Fellowship)主席 Janet Oliva 告诉 Hargrove:“我认为每个执法机构应该知晓和利用这个程序的数据库。”


600x-1 (2).png

亚特兰大的警方正在与 MAP 合作,追踪一连串未侦破的谋杀案。 但在其他地方,仍然有一些人对透明数据服务公益的力量表示怀疑。 首先,很贵。 Hargrove说:“这是一场公开讨论。事情在财政上变的如此糟糕,以至于市长不得不思考,‘在得知现在活的人需要帮助之时,我却把手中的资源用在关于解决死者的犯罪上,这有何意义?’”何不紧抓那些有证人、弹道学证据和DNA分析的易破案件,而把棘手案件排在次要的位置?


至少直觉上给出的答案似乎是,这些谋杀犯中的一些人将再次杀人。 但如果这是真的,就会影响谋杀率。果然,借由数据库,Hargrove已经证实这是真的。 通过对2014年《统一犯罪报告》(Uniform Crime Report)中提到的来自218个大都市辖区的信息进行分析,他发现,破案较低的地方,凶杀率几乎是破案率更高的地方的两倍——平均每10万人中就有9.6至17.9起谋杀。


600x-1.jpg

Hargrove 说:“这是完全有道理的,如果任由杀手走在街上,为什么不会导致更多的凶杀案? 当然会啊。”


其他人以不同的方式得出了相同的结论。Ghettoside 这本书对洛杉矶流行的未侦破案件进行了强有力的检视,本书作者 Jill Leovy 提出这一观点:侦破谋杀案会规范社会秩序,破除出现在法律约束力差和无政府主义地区的“街头司法”(“street justice”)的怪异现象。人们大量关注有关警察种族偏见的案例,以至于另一种不公平——公正彻底执法的缺乏——被忽视了。Mark Funkhouser,堪萨斯城前市长,现在的 Governing 杂志出版人去年秋天写道:“只停止错误的治安管理是不够的,真正关键的是要做更多正确的治安管理工作。”


多年来,一些研究表明,强大的社区治安管理和给予生活环境调查(casework)优先权有助于提高破案率,而不受工作量和预算的影响。这就是管理的用武之地。“当 Michael Nutter 在2007年竞选费城市长时,扬言将把解决重大犯罪作为任职期间的一个主要议题。” Hargrove 说,“如果没选他就糟了,如果他没那么做就糟了。”两年多来,费城的谋杀破案率从56%提高到了75%。


800x-1 (2).jpg

Hargrove在家里;照片由Cait Oppermann为彭博商业周刊拍摄。


在加利福尼亚州的圣安娜,一名新局长成立了一个专门针对团伙犯罪的破案小组,并吸引匿名捐款以重奖提供利于破案线索的人。自此之后,该地区破案率从1993年的28%爬升至2013年的几乎100%。在奥克兰,2012年的破案率降至30%,当地警方与 FBI 合作,向该部门仅有10名全职调查员的小队增加了5名特工,在2015年,破案率上升到60%。MAP 还与当地电视新闻台合作,曝光了湾区其他表现欠佳的警察部门。


Hargrove 说:「我不想打击某一位政治家,但根据我的经验,当你询问一个管理良好的治安辖区市长或警察局长破案率是多少时,他们能告诉你这个数字是多少,因为他们对此保持着关注。」


奥斯汀警方便是这样。加里地区的凶手 Vann 在德克萨斯州呆了几年,回到印第安纳不久后被捕。虽然加里的警方没有联络Hargrove,但奥斯汀警方联系了他,「他们说,我们想知道他在这里是否杀过人。」


Hargrove 将德克萨斯州每起窒息死亡案例的数据发给了奥斯丁警察。 Vann 看似循规蹈矩, Hargrove 也找不到任何与他的犯案模式相配的案例。Hargrove 说:「他们肯定已经同意了,所以这是一种咨询」。可能是众多案例的第一例。

声明:本文由机器之心编译出品,原文来自bloomberg,作者Robert Kolker,转载请查看要求,机器之心对于违规侵权者保有法律追诉权。