连环杀手应该害怕这个算法 - 彭博社
bloomberg
在2010年8月18日,印第安纳州加里市的一名警察中尉收到了一封电子邮件,主题行就像是大卫·芬奇电影开头几场中的内容:
“加里地区可能有连环杀手活动吗?”
不清楚这位中尉对这封电子邮件做了什么;如果他把它当作恶作剧而不予理会,那也是可以理解的。但作者却是非常认真。他附上了来源材料——从FBI档案中创建的电子表格,显示在数年间,加里市记录了14起未解决的女性谋杀案,受害者年龄在20到50岁之间。每起死亡的原因都是一样的:窒息。与全国的统计数据相比,他写道,加里市类似的杀人案件数量远高于正常水平。在同一个城市中,有这么多人以相同的方式死亡——难道这不意味着至少有一些,甚至更多的案件可能是相互关联的吗?而且杀手可能仍然在逃?
这位警察中尉从未回复。十二天后,警察局长加里·卡特收到了同一位作者发来的类似电子邮件。这条消息增加了一些细节。几名女性是在家中被窒息的。在至少两个案件中,谋杀后还放火。在最近的案件中,几名女性在废弃建筑物内或周围被发现窒息。作者问,这一切难道不值得关注吗?
加里警方也没有回应那封电子邮件,或者通过挂号信发送的两封后续信件。该部门没有人公开评论他们收到的内容——也没有人愿意对此故事发表评论。“这是我职业生涯中最令人沮丧的经历,”这些信息的作者,61岁的退休新闻记者托马斯·哈格罗夫说。
关于谋杀问责项目网站的数据。照片由Cait Oppermann为彭博商业周刊拍摄哈格罗夫在职业生涯中一直是一名数据专家。他在密苏里大学作为新闻专业学生时分析了第一组民意调查数据,并成为该大学民意调查组织的学生主任。他大学毕业后直接加入了E.W. Scripps报纸,并将自己的技能从政治民意调查数据扩展到几乎任何需要统计分析的主题。“在新闻编辑室,”他回忆道,“他们会说,‘把这个交给哈格罗夫。这是个数字问题。’ ”
2004年,哈格罗夫的编辑要求他研究与卖淫相关的统计数据。研究这一点的唯一方法是获取全国最全面的犯罪统计数据存储库的副本:联邦调查局的统一犯罪报告(UCR)。当哈格罗夫从密苏里大学的数据库图书馆调取该报告的副本时,附带着他意想不到的东西:补充谋杀报告。“我打开它,看到的是我从未见过的记录,”他说。“逐行列出每一个报告给FBI的谋杀案。”
这份涵盖2002年的报告包含约16,000起谋杀案,按受害者的年龄、种族和性别分类,以及杀人方法、作出报告的警察部门、案件已知的情况和关于犯罪者的信息(如果犯罪者已知)。“我不知道这些想法从何而来,”哈格罗夫说,“但我一看到那个东西,就问自己,‘你认为教计算机识别连环杀手可能吗?’ ”
像很多人一样,哈格罗夫意识到警方在调查困难案件时受到隧道视野的批评。他听说过“关联盲点”这个术语,用来描述执法辖区未能将发生在县或州边界之间的类似案件联系起来的倾向。哈格罗夫想,这份报告中可能有解决关联盲点的解药。合适的人,以正确的方式查看信息,可能能够识别出任何数量的在逃连环杀手。
每年他都会下载并分析最新的数据集。令他真正震惊的是,从未结案的谋杀案件数量。(在执法中,当嫌疑人被逮捕时,案件被视为结案,无论最终结果如何。)哈格罗夫统计了211,487起,这超过了1980年至2010年记录的谋杀案的三分之一。他想,为什么公众对如此大量未解决的谋杀案没有感到愤怒呢?
更糟糕的是,哈格罗夫看到,尽管在打击犯罪科学方面经过了一代人的创新,包括DNA分析,结案率并没有增加,反而在下降——甚至是暴跌。1960年代的平均谋杀结案率接近90%;到2010年,它稳固在60年代中期。此后还进一步下降。
这些令人不安的趋势促使哈格罗夫给加里警方写信。他在那里没有得到任何回应。果然,四年后,即2014年10月,在印第安纳州的哈蒙德——加里的邻镇——警方在一个6号汽车旅馆的房间里发现了19岁非裔女孩阿弗里卡·哈迪的尸体。通过她的手机记录,他们追踪到了一个嫌疑人,43岁的 达伦·迪昂·范。一旦被捕,范带警方去他藏匿的六具尸体的废弃建筑,所有尸体都在加里及其周边。安妮斯·琼斯最后一次被看到是在10月8日;特雷西·马丁在6月失踪;克里斯汀·威廉姆斯和索尼娅·比林斯利在2月失踪;泰阿拉·巴特和坦娅·加特林在1月消失。
在行使他保持沉默的权利之前,范随口提到他已经杀人多年——自1990年代以来。哈格罗夫前往加里,为斯克里普斯报道,调查他在2010年识别的案件中是否有可能归因于范。他记得只收到一个有帮助的回复,来自湖县的一位助理验尸官,承诺会跟进,但那也没有结果。现在,随着范的起诉在法庭上缓慢进行,所有参与此案的人都受到禁言令的限制,无法公开猜测哈格罗夫在2010年提到的任何受害者是否也可能是范杀害的。“至少有七名女性在我试图说服加里警方他们有一个连环杀手后死亡,”哈格罗夫说。“他是个相当糟糕的杀手。”
哈格罗夫也关注其他可能的杀手。“我认为外面有很多未被捕获的连环杀手,”他宣称。“我认为大多数城市至少有几个。”
我们正处于一个时刻,在全国整体犯罪率下降的几十年后,许多美国主要城市的谋杀率开始缓慢上升。连续两年,主要城市的凶杀案平均增长超过10%。 (当然,这些增长并不均匀:芝加哥从2015年的485起报告杀人案件跃升至2016年的762起,而纽约和巴尔的摩的谋杀人数则有所下降。)特朗普总统在竞选期间及之后,誓言开启一个新的法治时代,特别在推特上对芝加哥的“屠杀”进行抨击。
除了联邦干预的威胁,解决高谋杀率的问题将很困难,首先需要解决清除率。因此,或许我们生活在一个数据分析应该帮助我们解读、检测和预测从总统选举结果到棒球运动员表现的时代,这一点是幸运的。迈克尔·刘易斯的 金球 为很多人带来了数据驱动的解决问题的方法,向非棒球迷公众介绍了大联盟球员的统计评估,并让奥克兰运动家队的高管比利·比恩成为英雄。执法部门似乎是一个数据能够发挥作用的肥沃领域:在1990年代,纽约警察局以著名的方式利用数据更聪明地部署警员到犯罪发生的地方,其CompStat系统成为全国其他部门的标准。
哈格罗夫所能做到的事情远远超出了这一点。他的创新在于教会计算机识别未解决谋杀案中的趋势,利用公众可获得的信息,这些信息之前没有人,包括执法人员,使用过。这使得他在某种意义上成为了谋杀案的比利·比恩。他的工作揭示了一个长期未解答的问题:究竟为什么警方在解决谋杀案方面没有任何进展?而在如此多的杀手仍然在街头游荡的情况下,我们又如何能梦想逆转任何凶杀率的上升呢?
哈格罗夫在弗吉尼亚州亚历山大的家庭办公室。摄影:凯特·奥普曼为《彭博商业周刊》拍摄哈格罗夫的编辑在斯克里普斯花了几年时间才同意给他足够的时间去深入研究FBI的凶杀数据。在密苏里大学的一名研究生的帮助下,哈格罗夫在2008年首次将凶杀报告导入统计软件。他花了几个月的时间试图开发一种算法,以识别具有足够共同特征的未解决案件,从而暗示同一名谋杀犯。最终,他决定通过将自己的想法与一个著名案件进行对比来逆向工程该算法,即加里·里奇韦,所谓的绿河杀手,他承认在西雅图地区杀害了48名女性,历时二十年。哈格罗夫认为,如果他能设计出一个能够找出绿河杀手受害者的算法,他就知道自己走在了正确的道路上。
“我们发现了一百种不奏效的方法,”他回忆道。最后,他确定了所谓聚类分析的四个特征:地理、性别、年龄组和杀人方法。在性别方面,他坚持选择女性,因为她们占据了大多数与帮派活动无关的多重谋杀受害者。当他使用20到50岁之间的女性——这一年龄段是连环杀手最常针对的群体时,算法像老虎机一样闪烁。“显然,这个东西在起作用,”他说。“事实上,它的效果太好了。”
绿河杀手在这个算法中立刻被提了出来。这是个好消息。哈格罗夫的算法还找出了洛杉矶的77起未解决谋杀案,他了解到这些案件被归因于警方正在追捕的几名不同的杀手(包括所谓的南区屠杀者和最近的格林睡眠者),以及凤凰城的64起女性未解决谋杀案。
然后还有一组可能的连环杀手,这些人未被当地警方识别。“这个算法的整个目的就是找到那些显而易见的聚集点,”哈格罗夫说。“但全国各地都有数十个这样的案例。”
2015年,斯克里普斯剥离了最后一家报纸,哈格罗夫和其他印刷记者失去了工作。“唯一一个离开时心情轻松的人就是我,”他说。哈格罗夫当时59岁,在公司工作了37年,符合领取丰厚遣散费和不错养老金的条件,使他得到了很好的保障。现在他有足够的时间全力投入到他的数据项目中。他创立了 谋杀问责项目,简称MAP,这是一个小型非营利组织,旨在使FBI的谋杀数据更广泛和更容易获取。
通过信息自由法案(FOIA)请求,MAP试图追踪那些由于官僚懒惰、缺乏人力或可能只是纯粹无能而未向FBI提供谋杀数据的许多市政和县的数据。MAP已经汇总了1980年至2014年间638,454起谋杀案的案件细节,包括23,219起未向FBI报告的案件。这是美国谋杀案案件级别细节中最完整的列表,且该组织的网站已将所有数据开源。任何拥有统计分析软件的人(在线免费提供)都可以开始在不同管辖区中寻找连环杀手。任何人都可以将定罪杀手的时间线与未解决谋杀案的时间进行比较,以确定是否存在合理的联系。“你可以打电话给你的家乡,看看是否有任何可疑的情况,”哈格罗夫说。“如果你是一个被谋杀女儿的父亲,你可以查阅她的记录,看看是否有其他记录匹配。我们希望能够众包谋杀案。”
警方从未善于利用自身统计数据的力量。警察文化显著地以纸质为主,分散且孤立,部门并不总是对技术创新持开放态度。国家犯罪信息中心(NCIC)数据库使警方能够访问逃犯逮捕令、被盗财产和失踪人员等信息,但对于未解决的谋杀案无法进行搜索。疾病控制与预防中心的国家暴力死亡报告系统汇总了32个州的基于死亡证明的谋杀受害者信息,但同样无法搜索未结案的案件。一些州有自己的谋杀数据库,但它们无法查看其他州的数据,因此链接盲区依然存在。
在1990年代,联邦调查局创建了另一个自愿报告数据库,专门针对暴力和性犯罪,称为暴力犯罪逮捕计划(ViCAP)。它也未能成功,主要是因为它是自愿的,这使得警察部门容易忽视。“大多数执法机构对ViCAP的目的没有真正清晰的理解,”该项目的负责人格雷戈里·库珀说,他管理该项目三年。“令人沮丧的是,我有一辆车,但没有人给它加油。”哈格罗夫称ViCAP是“一个从未得到适当资助的实验,大多数警察部门从未真正认同这个想法。”
所有这些都导致了,或者至少未能缓解《统一犯罪报告》和其补充谋杀报告中的趋势。哈格罗夫对这些数据的分析显示,清除率与几十年前相比已经如此之低,从2014年的64.5%下降到2015年的61.5%。这意味着2015年有6,043起谋杀案件未导致逮捕。他详细分析了这些发现,了解到大城市的清除率往往比小城镇更低,这可能是因为在较少人口的地区重大案件更为罕见,因此往往受到特别关注。(这或许至少部分解释了为什么加拿大每年约75%的500到600起谋杀案得以结案。)
哈格罗夫还了解到,并非所有大城市在谋杀方面都是一样的。“差异令人震惊,”他说。洛杉矶、纽约和休斯顿的破案率远高于平均水平——在70%左右。班级底部包括新奥尔良、底特律和圣路易斯,破案率都在40%左右。
在谋杀率顽固高企的大城市,警方将矛头指向帮派和毒品相关的杀戮,以及目击者不愿站出来指认凶手。“最大的问题是每个人都认识每个人,”宾夕法尼亚州切斯特市警察局局长达伦·阿尔斯顿告诉《费城日报在九月。(切斯特的谋杀率超过了所有其他美国城市——并且是附近费城的两倍多。)市民反过来又指出对警方缺乏信任。但另一个显而易见的问题是资源。“我们资助谋杀调查的方式就像资助教育一样——这归结为地方税收,”哈格罗夫说。“当经济崩溃到一定程度,我们不得不开始解雇警察时,我们看到一切都变得糟糕。”
MAP在其网站上也跟踪人员配置趋势。哈格罗夫指出,自1990年代以来,密歇根州弗林特和俄亥俄州代顿的破案率下降了超过30个百分点,这与警察人力的巨大减少相吻合(弗林特从330名警察减少到185名;代顿从500名减少到394名)。当哈格罗夫的团队提交信息自由法案请求以获取关于底特律一名疑似连环杀手的谋杀数据时,警方的回应是缺乏预算来满足该请求。“当一个城市说,‘我们太穷了,连记录都无法提取’时,你该怎么办?”哈格罗夫说。“我开玩笑说,我们所做的就是创造了一个相当于失败的政府探测器。”
不过,有一种观点认为,破案率不仅仅是警察部门人员配置的结果。优先事项和管理也起着重要作用。在2000年,马里兰大学的犯罪学家查尔斯·韦尔福德发表了一篇开创性的 论文,在其中他确定了有效解决谋杀案件的部门的共同特征。该列表的第一条是确保警察能够在谋杀后的关键早期时段追踪线索,即使这意味着需要加班。韦尔福德目前的研究密切关注每位警官的支出金额、每个案件的支出金额以及警队中侦探的比例。韦尔福德表示,破案率“在很大程度上取决于优先事项和资源。我已经不再认为这是一个悬而未决的问题。现在对我来说的问题是:我们如何利用部门现有的资源来改善他们在解决严重犯罪方面的工作?”
哈格罗夫自从创办他的组织以来,了解到的最令人沮丧的事情是,全国有多少警察部门不仅忽视联邦调查局的数据,而且根本不愿意与联邦调查局分享他们的数据。在这些违规者中:伊利诺伊州,MAP已就该信息对其提起诉讼。哈格罗夫最近报告称,2015年伊利诺伊州的谋杀案更可能未能侦破:756起谋杀案中仅有37.3%的案件被解决。这个可怕的破案率似乎在很大程度上解释了芝加哥臭名昭著的谋杀率上升,正当总统和其他人开始寻找解决方案时。
通过与加里警方的经验,哈格罗夫学到了数据的第一个重要教训:如果是坏消息,并不是每个人都想看到这些数字。最近,他开始强迫这个问题。与MAP副主席埃里克·维齐格(Eric Witzig)一起,后者是一位曾与ViCAP合作的退休FBI调查员,哈格罗夫在国际凶杀调查员协会的会议上以及在弗吉尼亚州昆蒂科的FBI培训部与凶杀案侦探进行了教学会议。哈格罗夫通过使用琼·贝内特·拉姆齐案作为数据库的测试来吸引房间里侦探的注意。侦探们观看他选择“科罗拉多州”作为州,“窒息”作为武器,“女性”作为受害者性别,以及“6”作为受害者年龄。科罗拉多州只有一个这样的案件,琼·贝内特。但随后哈格罗夫扩大了标准,包括5到10岁女孩的窒息案件,第二个科罗拉多案件出现了:梅兰妮·斯图尔姆(Melanie Sturm),一名1985年在科罗拉多斯普林斯被发现窒息的10岁女孩。然后他将范围扩大到全国,发现27个未解决的案件,其中11个在西部州。他向他们展示了将这些信息下载到列表中的简单性。这就像是来自CSI的东西。“我相信每个执法机构都应该了解并利用这个程序的数据库,”FBI国际刑事调查分析奖学金的主席珍妮特·奥利瓦(Janet Oliva)告诉哈格罗夫。
亚特兰大的警方现在正在与MAP合作追踪一系列未解决的谋杀案。但在其他地方,仍然对透明数据服务于公众利益的能力持怀疑态度。首先,这很昂贵。“这是一个公开的辩论,”哈格罗夫说。“外面的财务状况变得如此糟糕,以至于市长们在想,‘我花资源去解决死者的犯罪是否有意义,而我还有活着的人需要帮助?’为什么不直接抓住简单的案件——那些有证人、弹道和DNA的案件,把困难的案件搁置一旁呢?”
答案,至少直观上,似乎是这些谋杀者中至少有一些会再次杀人。但如果这是真的,它应该会影响谋杀率。果然,使用他的数据库,哈格罗夫确认了这一点。从2014年统一犯罪报告中提取218个大都市辖区的信息,他发现,在清除率较低的地方,谋杀率几乎是清除率较高地方的两倍——每10万人中从9.6起到17.9。
“这完全有道理,”哈格罗夫说。“如果你让杀手在街上游荡,为什么这不会导致更多的杀戮?答案是,确实如此。”
其他人以不同的方式得出了相同的结论。在 贫民区的另一面中,作者吉尔·莱欧维对洛杉矶未解决谋杀案件流行现象进行了有力的审视,提出了解决谋杀案件使社会秩序合法化的观点,削弱了在无序地区出现的“街头正义”现象,使人们感到无能为力。由于对警察种族偏见案件的关注,另一种不公正——缺乏彻底的警务——被忽视了。“仅仅停止错误的警务是不够的,”密苏里州堪萨斯城的前市长马克·芬克豪瑟去年秋天写道,现在是杂志 治理 的出版人。“我们必须做更多正确的事情。”
多年来的一些研究表明,强有力的社区警务和将案件工作列为高优先级可以提高清除率,而与工作量和预算无关。这就是管理的作用。“当迈克尔·纳特在2007年竞选费城市长时,他说,‘我会把解决重大犯罪作为我政府的主要问题,’”哈格罗夫说。“好吧,真是的,他们选了他,真是的,他确实做到了。”在两年内,费城的谋杀清除率从56%提高到75%。
哈格罗夫在家。由凯特·奥普曼为彭博商业周刊拍摄的照片在加利福尼亚州圣安娜,清除率从1993年的约28%上升到2013年的几乎100%,这是因为一位新的警察局长成立了一个专门针对帮派的谋杀单位,并吸引了匿名捐款,以提供更高的奖励以获取导致逮捕的线索。在奥克兰,清除率在2012年降至30%,警方与联邦调查局合作,向该部门的10名全职谋杀调查员小组增加了5名特工;到2015年,清除率上升到60%。MAP与当地一家电视新闻台联手,关注湾区其他表现不佳的警察部门。
“我不想抨击某个特定的政治家,”哈格罗夫说,“但根据我的经验,当你问一个表现良好的警察辖区的警察局长或市长他们的清除率时,市长和警察局长可以迅速说出这些数字,因为他们在关注。”
奥斯汀的警察也是如此。加里谋杀犯范恩在从德克萨斯州搬回印第安纳州后不久被捕,他在德克萨斯州待了好几年。虽然哈格罗夫没有收到加里警方的回复,但他收到了奥斯汀警方的消息。“他们说,‘我们需要知道他是否可能在这里杀过人。’”
哈格罗夫向奥斯汀警方提供了德克萨斯州每一起窒息死亡的资料。看起来范恩一直保持清白;哈格罗夫没有看到任何与他的模式相匹配的案件。“他们一定同意了,”哈格罗夫说,“所以这是一种咨询。”也许是许多咨询中的第一次。