AI先驱李开复在八个月内创立了价值10亿美元的初创公司-彭博社
Saritha Rai, Peter Elstrom
李开复
摄影师:Hollie Adams/Bloomberg由计算机科学家李开复创立的一家中国初创公司凭借一种新的开源人工智能模型在不到八个月的时间里成为了一家独角兽,该模型在某些指标上超过了硅谷最好的模型。
这家名为01.AI的公司在一轮融资中获得了超过10亿美元的估值,其中包括阿里巴巴集团的云计算部门,李开复在接受采访时表示。风投公司创新工场的首席执行官也将担任这家新创公司的CEO。他从3月开始组建了01.AI团队,并于6月开始运营。
这家北京初创公司的开源基础大型语言模型Yi-34B现在已经在中文和英文版面向全球开发者开放。大型语言模型,或LLMs,是在大量数据上训练的计算机算法,用于阅读、理解和生成类似人类的文本、图像和代码。
在关键指标上,Yi-34B的表现优于市场上已有的领先开源模型,包括Meta Platforms Inc.的备受推崇的Llama 2。Hugging Face,该公司为各种类别中表现最佳的LLMs提供排行榜,上周末发布的评估将这款中国模型排名第一,被称为预训练基础LLMs。
“Llama 2一直是开源社区的黄金标准,对此李61岁在Zoom采访中表示。“我们希望不仅为中国市场,也为全球市场提供一个更优越的选择。”
总部位于旧金山的OpenAI去年推出其ChatGPT聊天机器人后,引发了人工智能领域的狂热兴趣。Alphabet Inc.、Microsoft Corp.和Meta已经投入数十亿美元进行研究和开发,力求在生成式人工智能等新兴领域取得领导地位。埃隆·马斯克刚刚推出了一个名为Grok的聊天机器人。
在中国,科技巨头和企业家也纷纷进入这一领域,搜索领导者百度公司展示了其声称与OpenAI技术媲美的Ernie LLM版本。阿里巴巴支持了至少三家在这一领域的初创公司,包括01.AI。两国的人工智能公司在很大程度上并不相争,因为美国的技术在中国不可用。
然而,美中之间不断升级的政治紧张局势使人工智能的发展变得更加复杂。美国总统乔·拜登的政府去年禁止向中国客户出售Nvidia Corp.最先进的人工智能半导体,理由是担心这项技术可能被用于军事应用的人工智能模型训练。上个月,美国进一步加强了这些限制,禁止Nvidia出售专门为中国设计的略低级别的芯片。
李称这种情况“令人遗憾”,但表示01.AI已经为可预见的未来储备了所需的芯片。这家初创公司今年早些时候开始积累半导体,甚至向创新工场借钱购买。
他说:“基本上我们押上了所有家当,超支了我们最初的银行账户。我们觉得我们必须这样做。”
李曾在谷歌、微软和苹果工作,后来转向风险投资,他在01.AI组建了一个100多人的团队,吸引了来自美国公司和一直在海外工作的中国国籍人士的前同事。他说,这个团队不仅包括AI专家,还有经验丰富的商业人士,可以帮助处理从并购到首次公开募股等各种事务。
01.AI已经在刚刚推出的开源模型之外规划了其商业策略。这家初创公司将与客户合作开发专有替代方案,针对特定行业或竞争情况定制。例如,Yi-34B的名称来源于训练中使用的340亿参数,但该初创公司已经在研发一个超过1000亿参数的模型。
李说:“我们的专有模型将与GPT-4进行基准测试”,他指的是OpenAI的LLM。
他表示,为全球银行、保险公司和贸易公司等全球公司提供英语和中文系统将是一个优势。该初创公司计划未来添加更多语言。
阅读更多: 亿万富翁和官僚们动员中国与美国展开人工智能竞赛
李开复在人工智能领域的工作可以追溯几十年前。在1982年申请卡内基梅隆大学研究生时,他写道,他希望将自己的一生奉献给人工智能研究,因为这项技术将帮助人类更好地了解自己。他后来写了两本畅销书,分别是《AI超级大国:中国、硅谷和新世界秩序》和《AI 2041:我们未来的十个愿景》
“这是人类的最大突破,”李开复说。“这也是了解自己的最后一步。”
他说,他经常想知道这项技术的承诺是否会在他的有生之年实现,直到他看到最新一代的LLM的力量。由于对技术的承诺和作为计算机科学家、作家和高管角色之间连接的机会,他决定离开他通常的风险投资家角色,成为一家初创公司的首席执行官。
01.AI选择构建一个开源模型,因为绝大多数人工智能开发者无法负担或不需要最大、最昂贵的模型。开源人工智能系统就像开源软件一样,其中的源代码可以被修改和增强。
刚推出的人工智能系统的规模为340亿个参数,这个规模经过精心选择,以便在不是价格昂贵到无法承受的计算机上运行。该公司还发布了一个60亿参数的模型,以吸引更广泛的开发者。“这是一个经过深思熟虑的决定,”李开复说。“世界不需要另一个随意的模型,世界需要我们。”
李说,他的风险投资公司的有限合伙人们问了他一些问题,询问他将如何平衡自己担任双重CEO的角色。他指出,如果他每周花40个小时在创新工场上,还有另外128个小时。他说:“我还有86个小时可以用来工作在01.AI上,而不会忽视我的创新工场职责。”他表示,他可能每天分配六个小时用于睡眠和生活中的其他事情。