多伦多团队正探索让AI“看见”世界的新方式
2012 年,杰弗里·辛顿(Geoffrey Hinton)改变了机器看待世界的方式。
来自多伦多大学的辛顿教授联手该校的两位硕士研究生共同构建了一个系统——它可以分析数千张照片,还能自行识别像花、汽车之类的普通物体,准确率高得让人难以置信。
他和他的学生很快就转战 Google,而他们这个系统背后用到的数学技术——“神经网络”——也被推广到了整个科技世界。自动驾驶汽车正是依靠它来识别路标和行人的。
但正如辛顿所指出的那样,他的构想是有局限性的。例如,如果只用咖啡杯其中一面的图像对神经网络进行识别训练,那它就不太可能识别出倒置的咖啡杯。
现在,辛顿正和年轻的 Google 研究人员萨拉·萨贝尔(Sara Sabour)探寻一种可替代的数学技术。他把它称为“胶囊网络”(capsule network),这个构想的初衷是建立一套更接近人类视角的系统。如果说神经网络的视角还停留在二维空间,那么胶囊网络的视角可以是三维的。
69 岁的辛顿来自英国,今年在多伦多开设了 Google 人工智能实验室。据信,这个新实验室象征着尖端技术研究的未来:其中大部分预计将发生在美国以外的欧洲、中国以及像多伦多这样长期作为人工智能研究中心的地方——因为它们对外来的研究人员持更加欢迎的态度。
萨贝尔是一名来自伊朗的研究人员,她原本打算去华盛顿大学研究计算机视觉,结果工作签证被美国政府拒签,之后她才在多伦多找到了工作。
她的任务是把辛顿的概念性构想转变成“数学现实”(mathematical reality),而这个项目即将结出硕果。他们最近发表了一篇文章,表明在某些情况下,他们的方法可以更准确地从陌生的视角对物体进行识别。
萨贝尔说:“和大家现在正在使用的传统神经网络相比,它的归纳概括能力应该要强得多。”
本月,当我走进辛顿的办公室时,他还是穿着那件经常穿的领尖上系扣的衬衫和毛衣。他递给我两个看上去像是从旧玩具箱底翻出来的巨大白块。
辛顿解释说,这两个白块是一个金字塔的两半。他问我是否可以把金字塔拼完整,而这似乎并不是太难。这些白块形状怪异,每块都只有五个面。我要做的就是在两个白块间找到匹配的那两面,再把它们拼起来。可是我压根儿找不到。
他告诉我,大多数人都在这个测试中败下阵来,其中包括两位麻省理工学院的终身教授。一个拒绝尝试,另一个则坚持认为这是不可能做到的。其实这是有可能做到的,只是我们都失败了。辛顿解释说,这是因为这个拼图并不是从我们平常看金字塔的视角出发进行切割的。
我们识别一个物体时,不是先看其中一面、然后再看另外几面的,而是站在三维的空间、把物体当成一个整体进行识别的。而这个金字塔被切成两半的方式,使得我们无法像往常一样在三维空间里去识别它。
辛顿最终的目标是让“胶囊网络”为机器提供与人类相同的三维视角——让它们从一个角度了解咖啡杯的外观之后,能从任何角度把它识别出来。而神经网络是无法做到这一点的。
他说:“这是个被计算机视觉研究人员忽视的事实,大家犯了一个巨大的错误。”
神经网络是人脑神经元的近似模型,是通过识别大量数据蕴含的共同特征来学会完成特定任务的复杂算法。例如,通过分析几千张汽车照片,神经网络可以学习、识别某一辆汽车。
这个数学思想可以追溯到 1950 年代。得益于处理能力的提高以及互联网生成的大量数据,直到最近几年它才得到实际应用。在过去 5 年里,神经网络加快了从智能手机数字助理到语言翻译服务、再到自动化机器人的发展。
但是,从提供真正智能的机器上来看,这些方法还有很长的路要走。而且,还需要进行新的研究,才能生产出许多顶级科技公司现在看好的自动化机器,包括对话式计算机和无人驾驶汽车。
辛顿被誉为“人工智能教父”。他是一个规模虽小、影响力却与日俱增的专家小组的成员,他们正在努力推动该行业进入这些非传统的研究领域。
艾伦人工智能研究所(Allen Institute for Artificial Intelligence)位于西雅图,它的首席执行官奥林·艾奇奥尼(Oren Etzioni)对他称之为行业短视的现象感慨不已。他说,从长远来看,目前对神经网络的关注将会对人工智能的发展带来负面影响。
埃里克·霍维茨(Eric Horvitz)来自微软,负责很多有关人工智能方面的工作。他认为,相较于未来几年将会出现的技术,神经网络和相关技术只是微小的进步。
他说:“现在我们所从事的不是一门科学,而是一种炼金术(意指更落后的东西——译注)。”
辛顿承认,他在多伦多的项目迄今只取得了初步成果。而另一些人,如艾奇奥尼和霍维茨则认为,要生产出真正的智能机器将需要截然不同的技术。艾奇奥尼说,虽然机器学习方法仍然是人工智能的核心,但它们必须借助其它技术得以强化。它们在本质上是有局限性的,因为它们是在数据中学习,而正确的数据并非始终都可用。
但辛顿认为,随着计算机视觉以及会话式计算等技术的加速发展,他的胶囊网络最终可以扩展到更广泛的场合。胶囊网络旨在以更复杂和结构化的方式模拟大脑的神经元网络,他解释说,这种增加的结构也可以帮助其它形式的人工智能。
辛顿当然明白,许多人会对他的技术持质疑态度。但他也指出,五年前对神经网络持怀疑态度的人也不少。
他说:“我相信,历史将会重演。”