在数据领域,没有一个词会被忽视 - 彭博社
bloomberg
自9月11日以来,超过3000名基地组织成员被捕,全球约有100起恐怖袭击被阻止,FBI表示。关于这一切是如何实现的细节仍然保密。但毫无疑问,两个关键因素是电子监听——使用秘密的Echelon网络——和计算机数据挖掘。现在,这些技术正在进行调整——但令人担忧的隐私问题不会轻易平息。
Echelon是由国家安全局(NSA)及其在澳大利亚、英国、加拿大和新西兰的对应机构运营的全球窃听系统。几十年来,Echelon的电子耳朵一直在捕捉通过卫星、微波塔,甚至一些光纤和铜缆传递的所有通信。每天的拦截——电话、电子邮件以及网络上传和下载——足以填满国会图书馆10次。
NSA的超级计算机努力筛选这股数据洪流,以发现恐怖主义的线索。这些文件会送到人类翻译者和分析师手中,其余的则被丢弃。但人类的效率不如Echelon。2001年9月10日收集的两条阿拉伯消息暗示第二天会发生重大事件,但直到9月12日才被翻译。现在,情报机构发誓要做得更好,FBI表示它已经将翻译延迟缩短到12小时以内。
从长远来看,目标是近实时分析。这将为数据挖掘系统奠定基础,这些系统可以查看多个数据库并发现模糊的关联,从而警告正在酝酿的阴谋。恐怖主义信息意识(TIA)项目本应做到这一点,但由于隐私问题,国会在2003年终止了该项目。除了检查多个商业和政府数据库外,TIA还旨在生成自己的恐怖主义情景——例如对纽约港的攻击——然后确定有效的方法来揭露和遏制由计算机产生的阴谋。它可能会考虑搜索潜水学校和租赁潜水装备的公司的客户名单,然后在签证申请或航空乘客名单中寻找相似的名字。
TIA已经死去,但这个概念仍然存在。大多数参与数据库管理的公司,无论大小,现在都提供工具来查询愿意合作的合作伙伴的数据库。为了防止再次引发隐私恐慌,各种方法应运而生,以在这种数据库共享期间保护个人和公司机密信息的安全。这些方法大多在2003年由马克尔基金会智囊团召集的一个蓝丝带委员会的庞大报告中进行了探讨。该小组的成员包括网景通讯公司(TWX)创始人詹姆斯·L·巴克斯代尔和微软公司(MSFT)首席技术官克雷格·J·蒙迪。马克尔研究建议了一些确保个人数据通常不会被披露的方法,即使是对拥有适当许可的情报和执法人员也是如此。
一种工具是“匿名化”。使用加密学中的哈希技术,姓名和社会安全号码可以被转换成一堆毫无意义的字母和数字。数据挖掘软件仍然能够搜索和关联不同的数据库——例如,发现银行数据库中的可疑金融交易。但个人信息将保持隐蔽,直到代理人收集到足够的证据来证明解密的授权。
技术永远无法消除恐怖主义,但先进的数据挖掘等技术是目前可用的一些更强大的防止未来攻击的工具。
作者:奥蒂斯·波特,纽约