Graphcore的人工智能芯片可能会启动下一波计算浪潮 - 彭博社
Austin Carr
来自Graphcore的IPU加速卡。
摄影师:Catherine Hyland为彭博商业周刊拍摄西蒙·诺尔斯,Graphcore Ltd.的首席技术官,正在白板前微笑,绘制他对机器学习未来的愿景。他用黑色马克笔点出并图示人脑的节点:那些“反刍、深思、沉思”的部分。他的初创公司试图在其下一代计算处理器中近似这些神经元和突触,公司相信这可以“机械化智能”。
人工智能通常被认为是挖掘庞大数据集的复杂软件,但诺尔斯和他的联合创始人、首席执行官奈杰尔·图恩认为,运行软件的计算机中仍然存在更重要的障碍。他们在英国港口城市布里斯托尔的宽敞办公室中表示,问题在于,芯片——根据其功能被称为CPU(中央处理单元)或GPU(图形处理单元)——并不是为了以任何可识别的人类方式“沉思”而设计的。人脑使用直觉来简化问题,例如识别一个接近的朋友,而计算机可能会尝试分析那个人脸的每一个像素,将其与数十亿张图像的数据库进行比较,然后再尝试打招呼。当计算机主要是计算器时,这种精确性是有意义的,但对于人工智能来说,这种方式极其低效,处理所有相关数据消耗了大量的能量。
Graphcore 联合创始人兼首席技术官诺尔斯。摄影师:凯瑟琳·海兰德为彭博商业周刊拍摄当诺尔斯和更具商业头脑的图恩在2016年创立Graphcore时,他们将“较不精确”的计算置于他们所称的智能处理单元(IPU)芯片的核心。“你脑中的概念相当模糊。实际上,正是非常近似的数据点的聚合使你能够产生精确的想法,”诺尔斯说,他的英语口音和频繁的笑声让人联想到霍格沃茨的校长。(鉴于他不断在白板上讲解,图恩开玩笑称他为“诺尔斯教授”。)关于人类智能为何以这种方式形成有各种理论,但对于需要处理被称为“图”的巨大而模糊的信息结构的机器学习系统来说,构建一个专门连接节点状数据点的芯片可能是人工智能演变的关键。“我们想要构建一台非常高性能的计算机,以非常不精确的方式操控数字,”诺尔斯说。
彭博商业周刊博格包,托特包中的克罗克斯,如何赢得美国妈妈的青睐减税自我偿还及其他童话故事印度腐烂的米饭引发对莫迪食品政策的不满美国芯片引导的俄罗斯导弹击中了6岁女孩换句话说,Graphcore正在为计算机开发一种大脑,如果其联合创始人是对的,将能够更像人类一样处理信息,而不是通过巨大的数字运算来伪装。“几十年来,我们一直在一步一步地告诉机器该做什么,但我们不再这样做了,”图恩说,描述Graphcore的芯片如何教机器学习。“这就像回到1970年代——我们需要重新拿出我们的宽翻领——当微处理器首次问世时。我们正在重新发明英特尔。”
投资者赫尔曼·豪瑟(Hermann Hauser),Arm Holdings Plc的联合创始人,该公司控制着最广泛使用的芯片设计,他押注Knowles和Toon的IPU将释放下一波计算浪潮。“在计算机历史上,这只发生过三次,”豪瑟说——1970年代的CPU,1990年代的GPU。“Graphcore是第三次。他们的芯片是世界上伟大的新架构之一。”
Graphcore办公室的IPU服务器机架。摄影师:凯瑟琳·海兰(Catherine Hyland)为《彭博商业周刊》拍摄Graphcore的起源可以追溯到豪瑟在2011年和2012年为皇家学会(Royal Society)在剑桥大学组织的一系列研讨会,该学会的成员包括艾萨克·牛顿和查尔斯·达尔文。围绕国王学院的一个豪华餐厅,人工智能专家、神经科学家、统计学家和动物学家们讨论了先进计算对社会的影响。
Knowles,豪瑟称他“脑袋的大小如同地球仪”,在这个象牙塔中感到格格不入,尽管他是在剑桥开始的。1980年代毕业后,他在英国政府研究实验室研究早期神经网络。随后,他共同创办了Element 14,一家无线处理器初创公司,该公司在2000年以6.4亿美元出售给博通公司。不久之后,他和同样有半导体初创公司经验的Toon首次合作。2002年,他们创建了Icera,一家移动芯片制造商,约十年后以4.36亿美元出售给英伟达公司。(英伟达随后关闭了它。)那时,两人并不准备退休。“我们俩高尔夫打得都很糟糕,”Toon说。
他们在讨论其他想法时,诺尔斯参加了剑桥讲座系列。“我就是那个穿着高顶帽的邋遢家伙,只想造东西——你知道的,‘别管热力学,我想造一台蒸汽机!’”他回忆道。当时,剑桥信息工程教授史蒂夫·杨(Steve Young)给苹果公司出售了一项现在用于Siri的语音处理服务,他在讲解计算对话系统的局限性时,诺尔斯不断向他提问关于能效的问题。“我问他在算术运算中使用了什么数值精度,这对史蒂夫来说似乎有些突兀,”诺尔斯说,他强调“数字的精度在硅中作为能量的决定因素是非常关键的。”
几天后,杨给诺尔斯发了邮件,告诉他他的学生调查了这个问题,发现他们每次计算使用了64位数据。他们意识到,正如诺尔斯所建议的,他们可以使用8位的较低精度算术来执行相同的功能。当计算机的数学运算减少时,它可以利用节省下来的能量来处理更多的数据;这有点像人脑从计算餐厅的确切GPS坐标转变为仅仅记住其名称和所在社区。“如果我们构建一个更适合这种工作的处理器,我们可以将性能提高一千倍,”诺尔斯说。杨和其他人对此印象深刻,以至于诺尔斯和图恩决定必须创办Graphcore。他们早在2013年就开始筹集资金来开发这个想法,并在2016年向世界揭示了这家公司。
“这实际上不需要监督。机器正在自己找出该做什么”
半导体行业目前正在讨论 摩尔定律的可持续性,这一观察可以追溯到1960年代,指出芯片上的晶体管数量——因此,其性价比——大约每两年会翻一番。Graphcore的领导者们则更关注一个相关的概念,称为Dennard缩放,指出随着晶体管密度的提高,功耗需求将保持不变。但这一原则不再适用,向芯片中添加更多晶体管现在意味着芯片往往会变得更热且更耗能。为了缓解这个问题,一些芯片制造商设计他们的产品,使其不会一次性使用所有处理能力——芯片的未使用区域被称为“暗硅”——而是仅运行支持应用程序所需的部分。
Knowles和Toon表示,热量问题特别会阻止手机和笔记本电脑在未来几年内变得更快,除非电路能够进行根本性的高效重新设计。“我被给了一张空白纸开始,这在芯片设计中是从未发生过的,”Graphcore的芯片架构师Daniel Wilkinson说。他们挑战了由几十名工程师组成的团队,主要是他们过去创业公司的弃儿,设计一款能够同时利用所有处理能力,同时消耗的能量少于最先进的GPU的芯片。硅中较大的能量压力之一涉及数据的移动和检索,但历史上处理器与内存是分开的。Knowles表示,在这些组件之间来回传输数据“非常耗能”。Graphcore着手设计他所称的更“均匀结构”,将芯片的逻辑与内存“交织”在一起,这样就不必花费那么多能量将数据传输到另一块硬件。
经过三年的时间,他们对数百种芯片布局进行了计算机测试的模拟,最终确定了一种设计,拥有1,216个处理器核心,Knowles称之为“许多小型处理器岛屿,分配能源资源。”最终的IPU于2018年首次制造,是一款大小如小麦薄饼的光滑芯片,拥有近240亿个晶体管,能够以极低的功耗访问数据。“这些芯片的功耗为120瓦”—大约与一个明亮的白炽灯泡相同—“所以大约是0.8伏特和150安培,”Toon在布里斯托尔总部的一个杂乱电子实验室里说,手指滑过IPU镜面般的表面。
为了测试其原型,团队给它输入了一个标准的数据训练模型,包含数百万张常见物体(水果、动物、汽车)的标记图像。然后,一名工程师用自己猫咪Zeus的照片查询IPU,结果在一个小时内,计算机不仅正确识别了它,还正确描述了Zeus的毛色。“IPU能够识别它为一只虎斑猫,”Knowles说。自那次首次测试以来,IPU的速度加快,现在能够每秒识别超过10,000张图像。目标是让芯片能够处理和理解更复杂的数据模型,以至于系统能够在某种更基本的层面上理解什么是猫。“我们不告诉机器该做什么;我们只是描述它应该如何学习,并给它提供大量的示例和数据—它实际上不需要被监督,”他说。“机器正在自己找出该做什么。”
Graphcore的第一款芯片,巨人。摄影师:凯瑟琳·海兰德,彭博商业周刊在Graphcore办公室的五楼,庞大的工业空调向公司的数据服务器室喷射凉爽的空气,窗帘来回摆动,透入布里斯托尔五月中旬不寻常的阳光。尽管这些芯片在冰箱大小的机箱中堆叠在一起,能效极高,但机器仍然产生了可怕的热量。这些IPU服务器机架的计算能力足以执行64拍浮点运算,相当于183,000部iPhone X同时以最大速度工作。诺尔斯和图恩将他们的IPU昵称为“巨人”,以纪念世界上第一台电子可编程计算机,该计算机由英国政府开发,用于破解二战期间德国的加密信息。
Graphcore已从包括宝马、微软和三星在内的投资者那里筹集了3.28亿美元,去年12月的估值为17亿美元。它拒绝就其芯片的具体应用发表评论,理由是保密协议,但考虑到其投资者,一些应用似乎显而易见——自动驾驶汽车、类似Siri的语音助手和云服务器农场。但诺尔斯对人类改变应用最感兴趣,例如IPU在气候变化和医学研究中对科学家所需复杂分析的影响。
Graphcore联合创始人兼首席执行官图恩。摄影师:凯瑟琳·海兰德,彭博商业周刊为了帮助大型企业客户弄清楚如何构建使用芯片所需的下一代计算机,Graphcore 提供服务器蓝图,并将其产品与免费软件工具打包。“我们会给你计算机设计的配方,然后卖给你原料,”Toon 说。IPU 依赖于一种称为并行计算的概念。基本思想是,程序需要为每个处理器编写,以使其正常工作,但随着集成到芯片中的处理器数量激增——一个大型的 Graphcore 安装包含大约 500 万个处理器核心,并能够同时运行近 3000 万个程序——这一编码任务已超越了人类创作,这意味着编程必须自动化,以便处理器能够独立执行。通俗来说,Graphcore 将庞大的计算任务切分为迷你数据问题,这些问题在“微小的处理器岛屿”上分别处理,然后像海军陆战队的乐队一样同步,以在最有效的时刻分享它们所学到的东西。
宝马风险投资部门的首席投资者 Tobias Jahn 设想 Graphcore 芯片在汽车制造商的数据中心,甚至可能在其汽车中。“宝马对 Graphcore 成为大型全球硅供应商感兴趣,”Jahn 说。自动驾驶汽车必须以极快的速度执行如此多的关键任务,这使它们成为 IPU 之类产品的关键市场,因为云计算工作通常伴随着延迟。Arm Holdings 的联合创始人 Hauser,现在是 Amadeus Capital 的合伙人,估计每辆无人驾驶汽车可能需要两个 IPU。Graphcore 表示,它有望在 2019 年实现 5000 万美元的收入。
知名竞争对手也纷纷涌入这个领域。特斯拉公司最近申请了自己的人工智能芯片专利。谷歌去年推出了一类专为机器学习设计的微处理器。而Nvidia则一直在修改其主导的GPU芯片设计,使其精度降低但效率更高——更像Graphcore的产品。“其他所有人都在敲Nvidia的门,”研究公司Gartner Inc.的分析师Alan Priestley说。“Graphcore的位置很好,但与Nvidia的市场存在相比,它仍然是一个非常小的竞争者。因此,尽管他们的IPU在这些工作负载上可能比Nvidia的GPU更好,但他们面临的风险是客户选择‘足够好’而不是‘卓越’。”
另一个重大挑战是,如果如承诺所言,IPU使机器的运算能力比今天的计算机强大100倍,那么它们所带来的伦理困境。Toon和Knowles对这种技术可能被滥用于武器和专制监控的危险感到警惕。不过,他们表示,最终政府需要设定限制。“机器的力量给我们带来了航空公司和汽车,”Knowles说。“但它也给我们带来了坦克。社会必须随着时间的推移来确定善与恶的平衡。”
目前,Graphcore专注于开发更多软件,以让客户认识到IPU的强大,同时将业务扩展到联合创始人所看到的最终公开上市。公司在每个重大里程碑时都会开一瓶香槟,比如2017年底的5000万美元融资轮和2018年的1000万美元销售订单。这种增长的迹象在Graphcore的办公室随处可见,呈现出越来越多的空香槟瓶。Knowles和Toon总是从温斯顿·丘吉尔最喜欢的Pol Roger品牌开始,他们表示这代表着他们的骄傲,因为他们可能会给英国带来第一个像苹果或阿里巴巴集团那样的科技巨头。“从Pol开始,以Pol结束,”Knowles一边笑着一边说,宠爱着最近喝掉的9升Salmanazar香槟。“到你IPO的时候,你就开最大的瓶子。”