英伟达的人工智能芯片驱动ChatGPT,并引发了数十亿美元的激增 - 彭博社
Austin Carr, Ian King
Nvidia的新超级芯片,配备顶级的Hopper 100处理器。
摄影师:Kelsey McClellan,彭博商业周刊
第一次黄仁勋尝试ChatGPT时,他让它写一首关于他公司的诗。十多年前,黄仁勋打赌说 Nvidia公司的计算机芯片可以作为人工智能的大脑,结果让他很满意:“NVIDIA迎接挑战。/凭借他们强大的GPU和人工智能,/他们推动技术边缘的界限。” 这首机器人诗证明了,按照他的文学标准,这个赌注终于有了回报。
在过去的30年中,Nvidia芯片一直是视频游戏中超逼真爆炸和郁郁葱葱的主要引擎,比如使命召唤和反恐精英,但黄仁勋坚信它们也特别适合筛选人工智能所需的大规模数据集。为了帮助验证这一理论,他指示他的团队构建了一台专为人工智能设计的服务器,并在2016年首次亲自送到了埃隆·马斯克和山姆·奥尔特曼,OpenAI的创始人。这台售价为129,000美元的AI超级计算机大小如公文包,内含八个互连的图形处理器,可以在两小时内消化传统计算机处理器需要六天才能完成的工作。黄仁勋亲自将其送到这家初创公司的办公室作为礼物,当他指着这些组件时,马斯克像一个自豪的父亲一样对这个银色的盒子微笑。
从那时起,马斯克和阿尔特曼发生了激烈的分裂,但他们在一个方面是一致的:每个人都试图获得英伟达芯片用于不同的项目。去年底,OpenAI发布了ChatGPT,其大脑由超过20,000个英伟达图形处理器组成。根据研究公司Similarweb Ltd.的数据,这款聊天机器人在二月份达到了1亿用户,如果不是运行成本如此昂贵,这对OpenAI来说将是一场胜利。微软公司已经承诺投入超过100亿美元的资金,这将有助于支付不断上涨的计算成本,而这家初创公司的首席执行官阿尔特曼将需要更多来自英伟达的芯片以满足需求。黄仁勋表示他并不经常使用ChatGPT,但他注册了阿尔特曼公司提供的每月20美元的版本。“他需要这笔钱,”黄仁勋开玩笑说。
任何想要分享人工智能繁荣的公司也将如此。英伟达芯片是谷歌母公司Alphabet、亚马逊和微软使用的云基础设施的关键组成部分。数据中心运营商去年共花费了150亿美元与英伟达进行大宗订单交易。“你将看到大量类似ChatGPT的东西,”黄仁勋在5月17日的采访中在加利福尼亚圣克拉拉的英伟达总部表示。“这基本上是计算的重生,是我们所知的计算的重塑。”
黄在五月份台湾的舞台上。摄影师:Walid Berrazeg/SOPA Images/LightRocket/Getty Images一周后,黄向投资者展示了Nvidia业务的重生意味。来自数据中心的季度收入(Nvidia现在称之为“AI工厂”)飙升了14%,达到创纪录的42.8亿美元。其夏季销售预测比分析师预期高出53%,将其估值推至1万亿美元以上。它成为第九家达到这一标志的公司。一夜之间,Nvidia的市值几乎增长了一个长期竞争对手——Advanced Micro Devices Inc.(AMD)的整个市值,现在价值是另一家公司Intel Corp.的七倍。至少有三位华尔街分析师在其报告标题中使用了相同的词:“哇。”
黄是如何将这家视频游戏芯片制造商转变为人工智能先锋的,这常常被归因于他神奇的未来洞察力。他的副手们只会用平淡无奇的公司陈词滥调来解释。高性能计算副总裁Ian Buck表示,Nvidia是一家没有公司政治斗争的初创企业,他重复了11位同事在接受Bloomberg Businessweek采访时使用的短语版本。听起来他们好像被强迫输入了与ChatGPT相同的通用训练数据。
事实是,黄先生的错误几乎和他的正确一样多。英伟达在智能手机方面犯了错误,发布了几款失败的计算机图形卡,宣扬了短暂的时尚(“ 加密挖矿将会持续”),并在试图收购芯片设计公司Arm Ltd.的 400亿美元交易中被监管机构和竞争对手挡住了。黄先生展现出一种深深植入的求生本能。一旦意识到英伟达无法取胜,他可能会毫不留情地终止一个项目,或者羞辱高级员工以示立场。他自豪地谈到自己差点破产了七次,一遍又一遍地愿意承担这些风险,因为这些风险最终可能帮助他主宰计算机的未来。
英伟达突然成为世界上最重要的技术核心。它拥有一种名为数据中心加速器的芯片市场的80%,目前购买其人工智能处理器的等待时间为八个月。许多大型科技公司都在英伟达的订单备货中。但是,黄先生的一些最大客户多年来一直在设计他们自己的定制芯片,旨在减少对供应商如英伟达的依赖。目前,他们还在使用英伟达的产品。“英伟达必须因某种原因犯错,才能给竞争对手一个机会,”Harding Loevner LP的分析师克里斯·麦克(Chris Mack)说,Harding Loevner LP是一家拥有约1.6亿美元英伟达股票的投资公司。“没有可行的替代方案。”
“我们是一个能为您省钱的公司”
使人工智能成为可能的东西——ChatGPT的“诗歌”,那种能够自动驾驶的汽车软件,以及那张由计算机生成的 穿着蓬松夹克的教皇的照片——都是由Ampere 100实现的。这款芯片以19世纪法国物理学家安德烈-玛丽·安培命名,大小约为火柴盒大小。其表面看起来很光滑,直到在显微镜下观察,才会发现大约540亿个微小组件排列成类似东京地铁系统地图的形状。
Nvidia的芯片架构师花了四年时间完善A100的数字蓝图,然后将设计发送到台湾半导体制造公司(TSMC)或三星电子公司进行生产。当原型准备就绪时,它会被空运到美国,然后像贵宾一样,被从机场接到Nvidia的校园。在那里,它被引导到一个没有窗户的实验室,实验室里挂满了屏幕和悬挂在天花板上的冷却管道。(如果没有足够的预防措施,芯片可能会变得如此炽热以至于会燃烧起来。)
GPU测试装置。摄影师:Kelsey McClellan,彭博商业周刊工程师们的工作是让这些微小的火虫活过来,当他们将原型插入测试装置时,他们通常看起来像是恐惧到恶心的地步。他们祈祷它能够打开并且运行速度如预期那样快。任何故障可能需要硅修正,或者“重新旋转”,这可能需要数月时间,并且会导致数亿美元的销售损失。Nvidia的高级副总裁Jonah Alben表示,没有胜利的时刻,只有“逐渐减少的担忧感”。
黄先生创立Nvidia时,担忧只增不减。他当时30岁,拥有斯坦福大学电气工程硕士学位,并曾在包括AMD在内的多家芯片制造商工作过。1993年,他决定与另外两名工程师共同创办一家公司,因为他意识到需要专门的处理器来改善他喜爱的视频游戏。董事会成员Tench Coxe回忆道:“他对《模拟飞行》的激动是可以感受到的。”但是,他们最初的芯片,包括一个为世嘉梦幻卡通游戏机设计的芯片,失败了,因为他们押注在一种新颖但不受游戏开发者欢迎的架构上。Nvidia面临资金枯竭(他的一次濒临破产),于是黄先生退出了世嘉交易,并突然改变了方向。
相反,他开始专注于为运行微软Windows的计算机设计的新芯片,并签约了戴尔和Gateway作为客户。Nvidia在1998财年实现了410万美元的利润,这是计算机游戏的黄金时代,包括《半条命》和《星际争霸》的发布。该公司在随后的一年上市。当时黄先生说:“有人告诉我我是最难被击败的CEO。”到2006年,Nvidia已经出货5亿个图形处理器,并将其技术集成到了索尼PlayStation 3和微软的第一代Xbox游戏机中。
在大部分时间里,黄先生穿着有点像百思买员工的服装,正如苹果公司当时的硬件工程主管Jon Rubinstein所描述的那样。然后有一天,他开始穿全黑的衬衫、裤子和皮夹克,似乎从未改变过。他在采访和公开活动中交替展现出头脑风暴和幽默,但在办公室里,他可能是一个愤怒的老板,容易发脾气,有三个曾经被他骂过的人说,他们不愿透露姓名,以免再次被骂。其中一人回忆起,如果黄先生没有听到正确的答案,他会在咒骂声中要求高管找到能提供答案的下属。然后他会在沉默的愤怒中等待,查看收件箱,直到那个人到来或打电话。Nvidia发言人Bob Sherbin表示,公司领导人员的留任率很高,他们对黄先生“忠心耿耿”。他说:“他们欣赏他的幽默和对公司的热情。他们知道他对自己要求最严格。”几乎每位员工都需要通过电子邮件提交他们的“前五要点”,主题就是这样,其中许多直接送到黄先生那里。这应该包含他们紧迫目标的简明总结,以便他能够跟踪。
在大部分时间里,Nvidia 最重要的事情就是不被 Intel 摧毁。游戏帮助 Nvidia 开辟了其图形处理单元(GPU)的市场。但 Intel 的中央处理单元(CPU)则用于几乎所有其他用途。几十年来,Intel 一直是世界上最大的芯片制造商。其 CPU 自上世纪 80 年代以来一直存在于大多数计算机中,并占据了荒谬的 99% 的数据中心处理器市场份额。Intel 的芯片也可以运行游戏,但不如 Nvidia 的那么出色。
这就是区别所在:假设你要去杂货店购物。你的购物车就是 CPU。你在过道里走动,装满你需要的东西然后去结账。这是一个完全正常的购物方式。然而,GPU 就像雇佣了几十个拿着手提篮子的人。一个人拿着你的谷类食品,另一个拿水果,另一个拿卫生纸。每个购物者不能像购物车那样携带太多,但你可能猜到哪种方式会在*《超级市场扫货》*中获胜。
“每个人都害怕惹恼 Nvidia”
在计算机的几乎整个历史中,这并不重要,除非你喜欢玩视频游戏或进行电影编辑。Nvidia 的 GPU 能够执行加载数百万像素所需的特定和重复任务,比如*《侠盗猎车手》*。而 Intel 的 CPU 则可以打开 Excel 电子表格,运行网页浏览器,播放 YouTube 视频等。
GPU方式进行事务被称为并行计算,黄仁勋认为这可能对最具挑战性的技术问题产生深远影响。理论上,连接更多的GPU可以显著扩大系统在任何给定时间内处理数据的能力。他推断,这可以解决他所说的摩尔定律的终结。这条定律是由英特尔联合创始人戈登·摩尔在1960年代提出的,规定芯片上的晶体管数量大约每两年翻一番。这一非常准确的预测为半个世纪以来处理器性能带来了巨大提升,直到大约十年前事情停滞不前。在数据中心添加更多的英特尔CPU只是在象征性地用购物车堵塞杂货通道。
在2010年代,客户开始寻找其他选择,为黄仁勋创造了机会,他的GPU并行运算可以成为所有数据处理的完美替代品。但对于英伟达来说,一个巨大的障碍是当时几乎所有在服务器上运行的代码都是为CPU编写的,为英特尔编写的。幸运的是,对于英伟达来说,黄仁勋有一个即将实现的解决方案。2006年,他鼓动公司构建了一种名为Cuda的新编程语言,这是“计算统一设备架构”的缩写,可以扩展英伟达处理器可以运行的软件类型。
这个想法相当疯狂。Cuda团队不得不重新创建长期存在于CPU上的基本计算过程(数学库、调试工具等),这将使开发人员能够为GPU的并行处理能力构建软件。黄仁勋很快命令所有英伟达的新芯片设计都与Cuda兼容,付出了巨大的代价。他在收益电话会议上吹嘘教授Cuda的大学数量,这让金融分析师甚至一些无法理解这一切与游戏有什么关系的员工感到困惑。“那是摇钱树,”一位前英伟达副总裁说,他和本文中引用的其他一些人一样,要求匿名以避免疏远黄仁勋。“而且世界上不会缺少玩视频游戏的少年。”
早期的Cuda实验发生在海底。石油公司Schlumberger NV的子公司WesternGeco与Nvidia员工合作,优化了一种算法,用于在海底电子扫描寻找石油储藏迹象,一位前高级Nvidia工程师回忆道。“他们有如此多的数据,他们需要使用直升机将数据从船只传输到计算数据的地方,”这个人说。“所有这些数据都需要被处理并转化为‘在这里钻探。在这里查看。’字面上说,这是一个价值一亿美元的决策。”使用GPU,最终软件的初始测试能够比WesternGeco之前使用的计算机快六倍以上地挖掘数据。
解决这样一个棘手的问题证明了Nvidia的技术不仅仅局限于游戏,但直到2012年的一次学术竞赛中出现了一个更大的突破,其全部潜力才变得明显。一个名为AlexNet的项目创造了识别图像内容准确性的记录。其15.3%的错误率比第二名挑战者好了超过10个百分点。这个神经网络是用Cuda和两个Nvidia GPU进行训练的。AlexNet证明了由GPU驱动的人工智能可以在某些任务上达到接近人类水平。
当黄仁勋在2014年的Nvidia开发者大会上登台时,这个被称为“计算数学家的伍德斯托克”的事件,他大部分时间都在阐述人工智能的未来。“人们去那里期待看到爆炸和物理模拟,就像在Jensen的主题演讲中通常看到的那样,”Nvidia的应用深度学习研究副总裁Bryan Catanzaro说。“这完全让每个人都大吃一惊。”私下里,黄仁勋说他的公司终将超越英特尔。
Nvidia AI 研究员 Bryan Catanzaro。摄影师:Kelsey McClellan,彭博商业周刊Cuda 和面向 AI 的 GPU 只是黄仁勋在这个时期做出的许多赌注中的一部分,其中很多都失败了。他再次与英特尔争夺移动设备市场,但他们都输给了高通公司。 Nvidia 还尝试制造平板电脑、电视机顶盒和 智能音箱。但都没有成功。
了解黄仁勋的人说,他有一种非凡的能力,可以让公司集体记忆中的错误决策消失。这种《黑衣人》式的操作帮助他的团队迅速转向下一个项目。在多达 400 名员工的观众面前举行“对齐”聚会时,黄仁勋要求总经理们提出业务战略,他坐在第一排观看,并发表类似于 Simon Cowell 的评估。据三位参加过这些会议的人说,他的批评可以非常严厉。这些人说,公开的训斥并不是针对台上的人,而是针对黄仁勋身后的数百人。他们应该内化他的指示,并相应调整他们的行动——这种管理风格有点像并行计算。
“没有人真正知道这个黑匣子是如何工作的,但它可以处理大量数据,偶尔会产生情绪,”一位曾与黄仁勋密切合作的前任 Nvidia 高管说。“他几乎是完美的 AI。”
“我们对社交媒体感到恐惧,但我们不会因为人工智能而感到恐惧”
在新冠疫情期间,科技股飙升时,英伟达实现了两个将重新定义公司的里程碑。2020年7月,它被加冕为美国市值最高的芯片制造商。第二个月,英伟达宣布数据中心的季度收入首次超过游戏收入。“10年前他说英伟达会比英特尔更大,我相信了他,” 合约半导体制造商台积电创始人张忠谦说。
当时,黄仁勋在华尔街的说教关于人工智能并没有引起共鸣。人们在 玩更多的视频游戏,并在比特币和其他数字货币上押注巨额资金,推动了对英伟达GPU的需求,这些GPU在加密货币挖矿方面表现出色。黄仁勋试图利用这股势头并购芯片设计公司Arm,负责半导体行业中最广泛使用的设计标准。这项价值400亿美元的收购最终将确保英伟达在移动领域占据一席之地,并将其业务范围扩展到许多其他产品。但依赖Arm芯片设计的公司已经对英伟达不断增长的实力感到警惕,美国监管机构起诉阻止了这次合并。黄仁勋在2022年2月做出了让步。
与此同时,人工智能仍然是英伟达高管的主要关注点。首席财务官科莱特·克雷斯说,股东们很难理解这个概念。“‘你对着手机说出最近的星巴克在哪里—这就是人工智能,’” 她回忆说。“‘在幕后,有这个GPU在处理数据为你解决问题。’我都说了多少遍了。” 如今这些对话更容易了:“超级简单:ChatGPT,”她说。
询问Nvidia的客户与公司合作的感受,他们会告诉你这与Intel全盛时期的合作方式相似:没有折扣,没有谈判,没有插队。这解释了为什么一些Nvidia最大的买家正试图自己生产芯片。然而,没有一个公司能够与Nvidia的芯片设计和复杂编程相匹敌,这需要大量持续的投资和专业知识。“你希望其他供应商的速度和执行能力与Nvidia一样快,能够创造市场和工作负载,”亚马逊网络服务副总裁Nafea Bshara说。“我们都会处于更好的状态。”
一辆搭载Nvidia自动驾驶技术的梅赛德斯-奔驰。摄影师:Kelsey McClellan,彭博商业周刊马斯克在2018年试图让特斯拉摆脱Nvidia技术。他推出了一款特斯拉设计的芯片,最终取代了Nvidia在公司汽车内部的自动驾驶平台。“对他们来说,构建自己的芯片并在端到端上拥有控制是战略性的,”Nvidia自动驾驶软件副总裁Sarah Tariq说。她表示,特斯拉仍然是Nvidia GPU在数据中心培训方面的重要客户。而马斯克最近订购了数千块Nvidia GPU用于另一个AI项目,据新闻报道称。他要是在劳动节前收到它们就算幸运(不是因为黄仁勋记恨他,而是因为没有人会得到特殊待遇)。马斯克没有回应评论请求。
Tariq摄影师:Kelsey McClellan,彭博商业周刊Alphabet、亚马逊和微软也投资了数十亿美元用于芯片设计。谷歌在张量处理单元方面取得了重大进展。受欢迎的人工智能图像生成应用Midjourney在三月份表示,将采用谷歌的处理器进行模型训练,与英伟达GPU并用。纽街研究有限责任合伙公司的分析发现,谷歌的芯片每美元性能高出英伟达的A100多达六倍。但这也伴随着一些权衡——谷歌的处理数据方式不够灵活——这种优势不一定会持续一两年以上。
A100的继任者——以开拓性程序员格雷斯·霍珀命名的Hopper 100,目前已投入生产,并且已经达到了谷歌芯片的性能。即使是行业中最有影响力的人物也对黄秉忠“非常有礼貌”,据纽街分析师皮埃尔·费拉古称。“每个人都害怕惹恼英伟达。”(一位谷歌发言人表示,公司重视与英伟达的合作伙伴关系,认为其芯片与GPU互补。)
当被问及对其业务的威胁时,黄秉忠推辞了。他对英伟达GPU价格的抱怨感到恼火,并坚称客户从长远来看花费更少来为机器供电,因为它们非常高效。“我们是省钱公司,”他说。他拒绝谈论马斯克,并表示他不知道Midjourney的忠诚正在动摇。他说他不在乎他的客户是否成为竞争对手,他将继续将谷歌视为他最好的客户之一,因为它确实是他最好的客户之一。(根据彭博编制的数据,Alphabet Inc.是英伟达的第三大客户。)“我们几乎是在逃避竞争,”黄秉忠冷漠地说。“我是个懦夫。我讨厌为事情而战。”
黄说他希望美国和中国也能停止争斗。去年八月,Nvidia成为政府限制人工智能传播的目标。拜登政府现在要求出口Nvidia最先进的芯片,包括A100和H100,到中国需要许可证。因此,Nvidia迅速推出了一个功能受限的A100版本,不会触发限制,因为它访问数据的速度更慢。
美国不希望中国在芯片制造方面达到与之平等的地位;黄认为拜登总统的限制将产生相反的效果。他说,这些限制激励中国培育本土产业,而中国已经拥有50多家GPU公司。黄将赌注押得更高,并表示这些限制可能引发国际事件——具体来说,是对一个生产世界上大部分半导体(包括Nvidia的)的附近岛屿的入侵。“中国不会坐视不管被规范,”黄说。“你必须问自己,在什么时候他们会说,‘去他妈的。我们去台湾吧。我们已经没有什么好失去的了。’在某个时候,他们将一无所有。”
黄认为ChatGPT的到来是人工智能的“iPhone时刻”。它已经导致了微软必应搜索引擎的复苏,令Adobe公司的Photoshop具有令人着迷的新的文本转图像功能,以及医学研究方面的惊人进展。当然,Nvidia的GPU是所有这些的基础。
黄仕豪一直在全球各地跳跃,向无数次会议宣讲他的公司在人工智能革命中的角色。他亲自调整演示文稿,确保他的GPU照片角度看起来尽可能引人注目,并精心安排和调整Nvidia客户的标志的大小。然而,最近,他的幻灯片上出现了如此多的人工智能客户——百度、埃克森美孚、摩根大通、麦当劳、辉瑞——以至于这些标志现在在屏幕上变得微小,几乎看不清。
Nvidia总部。摄影师:Kelsey McClellan,彭博商业周刊在最近一个阳光明媚的下午,黄仕豪蹒跚进入了一个以迈克尔·克莱顿的《西部世界》命名的会议室。那天早上,黄仕豪飞往了另一个科技会议——这次在拉斯维加斯——发表了主题演讲,与客户握手,接受了电视采访,然后飞回硅谷进行这次采访。黄仕豪倒在了一张灰色沙发上。他有权感到疲倦,但他似乎在装出疲惫的样子作为一个玩笑。
即使已经60岁,黄仕豪并没有显示出想要把公司交接给别人的迹象。“我们公司是我知道如何经营的,”他说。“所以只要我在经营,那就是最重要的。”(他曾在一个晚会上嘲讽他的同行们说:“你们知道你们所有人都是在任期内工作。我是终身制。当你们的孩子在经营你们的公司时,我还会在这里。”)
几个月前,黄先生成为英伟达公司首席执行官的第30个年头,使他成为半导体行业任期最长的CEO。但他说,他的圈子里的人都知道他讨厌庆祝。他们甚至不提他的生日。“我收到的唯一一封邮件是来自人力资源IT系统的自动邮件,上面写着,‘亲爱的Jensen,您有一名员工达到了30周年纪念日。’而那名员工就是我,”黄先生自满地说道。“没有其他人说祝贺,祝您30周年快乐,什么的。”
英伟达公司位于加利福尼亚圣克拉拉的恩德沃大楼的员工办公室。摄影师:Kelsey McClellan,彭博商业周刊硅谷有一群让员工感到恐惧的CEO。但黄先生现在领导着一个塑造人工智能发展轨迹最重要的公司之一,而且相当一部分人担心人工智能可能带来的影响。他们想知道人工智能的领导者们信仰什么。他们是否具有道德?他们的员工是否有勇气提出异议?他们是否值得信任?
2016年,当黄先生将那台GPU超级计算机送到OpenAI时,他用记号笔在盒子上签名写道:“致Elon和OpenAI团队!致计算和人类的未来。”马斯克后来可能成为最热心的 人工智能批评者,称其为对社会的威胁,并表示他与OpenAI的分道扬镳是出于道德原因。他的联合创始人奥尔特曼警告说,人工智能带来的“灭绝风险”与核战争相当。开创性人工智能研究员杰弗里·辛顿曾表示,人工智能对人类构成的威胁比气候变化更为紧迫。
然而,当被反复追问这些问题时,黄回答说:“我不在乎山姆。我不在乎埃隆说了什么。我不在乎辛顿说了什么。只是问我。” 黄说,英伟达有软件防护栏,可以将人工智能限制在其分配的任务范围内。他倾向于用技术乌托邦的方式看待事物。
黄承认人工智能有潜力造成真正的伤害,但他说这与“化学战争、假新闻等危险”没有什么不同。他希望有针对性的政府监管——针对外科机器人,针对人工智能辅助飞行,但他说强制暂停人工智能发展的想法“愚蠢”,让人工智能安全的方法是推进人工智能。黄说,他的两个成年子女从未向他表达过对人工智能的焦虑,只是对其潜力感到惊叹。“我们害怕社交媒体,但我们不害怕人工智能,”黄说。(他随后澄清说他的两个孩子都在英伟达工作。)
几周后,黄飞往他的出生地台湾,发表了另一场关于人工智能未来的演讲。在台下,他向一群热烈的观众展示了英伟达最新的人工智能超级计算机,一个55英尺宽、4英尺深的系统,他称之为“一个巨大的GPU”,重达40,000磅。他说,这台机器可以运行得非常热,配备了2000个风扇,可以在几分钟内排出他所在的宽敞礼堂中的所有空气。黄走到他身后展示的机器的真人大小图像下,展示了它令人畏惧的规模;他将其比作四头大象。嗯,是的,这一点一点都不可怕。—与 Debby Wu