人工智能热潮依赖芯片,但供不应求-华尔街日报
Deepa Seetharaman and Tom Dotan
人工智能革命被谷歌首席执行官比作人类驯服火的过程。现在,如果这个行业能够确保数字燃料供应,那就太好了。
一种新型生成式人工智能系统的生命线——先进芯片的短缺引发了一场争夺计算能力并寻找变通方法的竞赛。用于人工智能的图形芯片(GPU)几乎全部由Nvidia制造。但随着ChatGPT的病毒式成功,对它们的需求激增远远超过了供应。
“由于短缺,这取决于你认识谁,”Lamini的联合创始人兼首席执行官Sharon Zhou说,Lamini是一家帮助公司构建像聊天机器人这样的人工智能模型的初创公司。“这就像疫情期间的厕纸一样。”
这种情况限制了云服务提供商如亚马逊和微软向OpenAI等客户提供的处理能力。AI开发人员需要服务器容量来开发和运行他们日益复杂的模型,并帮助其他公司构建人工智能服务。
即使是全球最有影响力的科技企业家也在努力获取计算能力。在5月16日的一次关于人工智能的国会听证会上,OpenAI首席执行官Sam Altman表示,如果使用ChatGPT的人数减少,由于处理器瓶颈,情况会更好。
“目前,获得GPU要比毒品困难得多,”埃隆·马斯克在5月23日告诉《华尔街日报》CEO理事会峰会。
然而,作为马斯克也有其好处。今年早些时候,一些初创公司急需 Oracle 的计算能力,却突然被告知一位买家已经购买了大部分Oracle的空余服务器空间,知情人士称。这些初创公司被告知,这位买家是马斯克,他正在建立自己的OpenAI竞争对手,名为X.AI,知情人士说。
对于训练大型AI模型、能够 生成原创文本 和分析的公司来说,获得数万个先进的图形芯片至关重要。创始人表示,如果没有这些芯片,支撑AI背后的大型语言模型的工作将变得缓慢得多。英伟达的先进图形芯片擅长同时进行大量计算,这对于AI工作至关重要。
瑞银分析师估计,ChatGPT的早期版本大约需要1万个图形芯片。马斯克估计,更新版本需要英伟达先进处理器的三到五倍。
特斯拉、SpaceX和Twitter的埃隆·马斯克与《华尔街日报》的Thorold Barker讨论技术。照片: 约翰·斯克里文纳为《华尔街日报》拍摄Nvidia的产品需求推动了该公司的股价上涨约167%。芯片成本有所不同,但Nvidia的先进人工智能芯片在一些零售商处售价约为33,000美元,尽管在高需求下可以在二级市场上卖出更高的价格。
一些投资者正在搜索他们的网络中的多余计算能力,而其他人正在组织大宗处理器和服务器容量的订单,这些订单可以在他们的人工智能初创公司之间共享。初创公司正在缩小他们的人工智能模型以使其更高效,购买具有相关图形芯片的自己的物理服务器,或者在短缺问题解决之前转向不那么受欢迎的云服务提供商,如Oracle,据人工智能投资者和初创公司称。
其他创始人只是在亚马逊和微软的销售人员那里乞求更多的算力。
周说,她与一位前Nvidia工程师共同创立的Lamini已经拥有了所需的芯片。她和《华尔街日报》采访的许多其他创始人拒绝透露他们确切地如何获得这些芯片。
“行业对GPU的需求强劲,”OpenAI的一位发言人表示,该公司致力于确保其客户拥有他们所需的容量。
Oracle和马斯克没有回应置评请求。微软和亚马逊拒绝置评。
许多人工智能创始人预计短缺问题将持续至少到明年。
一些公司正在封锁云容量,因为他们担心以后无法访问它们。“人们现在即使不需要也继续支付它们,”Arthur的首席执行官亚当·温切尔说,Arthur公司开发了工具来保护公司免受数据泄露等人工智能风险的影响。
能够获得计算能力的公司仍然可能需要等待数周才能使用,创始人和投资者表示。“即使你已经提前付款,也不意味着GPU会在第二天或第二周送到你手上,”Perplexity AI的首席执行官Aravind Srinivas说道,该公司开发了一款基于人工智能的对话式搜索工具。“你只能等待。”
服务器制造商及其直接客户表示,他们需要等待超过六个月才能获得英伟达最新的图形芯片。其中一家最大的服务器制造商Supermicro的首席执行官表示,公司的图形芯片系统备货量达到历史最高水平,公司正在加紧增加生产能力。
所有这些情况为这些先进芯片创造了一个二级市场,部分涉及在繁荣时期购买芯片进行挖矿的大型加密货币公司,如今在数字货币市场下滑之际不再需要这些芯片。
AI研究公司Generally Intelligent的首席执行官Kanjun Qiu自去年开始购买先进的图形芯片用于自己的服务器,使其能够度过当前的短缺。最近,一位风险投资家给她发消息询问是否有多余的容量可以租给其他初创公司。Qiu还没有决定是否要放弃她的芯片。
与此同时,OpenAI的Altman和其他员工一直在处理在其平台上构建AI服务的公司的投诉。
Nabla的首席执行官兼创始人Alex Lebrun表示,该公司开发了一款面向医生的AI助手,称OpenAI的软件在回答查询时可能需要长达两分钟的时间。Nabla利用人工智能自动生成笔记、转诊信和临床建议,其客户希望这些笔记能够立即生成。
作为一种变通方法,Lebrun表示,Nabla已经构建了一些更简单的模型,以更快地生成材料的初稿,然后依靠最新版本的ChatGPT进行最后的调整。“好的初创公司是那些学会如何绕过所有这些限制的公司,”Lebrun说,并补充说他已经直接向Altman提出了这些问题。
Altman和其他OpenAI代表告诉创始人们,公司正在与其最大的投资者和数据中心提供商微软合作解决这个问题。
—本文由Asa Fitch撰写。
请写信给Deepa Seetharaman,邮箱为[email protected],以及Tom Dotan,邮箱为[email protected]
发表于2023年5月30日的印刷版上,标题为“AI繁荣需要比它能获得的芯片更多”。