我国算力已达世界第二,未来将如何发展?
唐晓甫
【文/观察者网 唐晓甫】1月19日,在国务院新闻办举行的2023年工业和信息化发展情况新闻发布会上,工业和信息化部新闻发言人、运行监测协调局局长陶青介绍了我国制造业数字化转型相关情况。
在会上她表示,我国现有算力总规模已经位居全球第二。国内一定影响力的工业互联网平台超过340家,人工智能企业数量超过4400家。在全面数字化和人工智能发展等政策的推动下,重点行业转型步伐不断加快。大飞机、新能源汽车、高速动车组等领域示范工厂研制周期平均缩短近30%、生产效率提升约30%。
那么什么是算力呢?它为什么那么重要呢?
我国算力现状
中国信息通信研究院发布的《中国算力发展指数白皮书(2021年)》对于算力是这样解释的:从狭义上看,算力是设备通过处理数据,实现特定结果输出的计算能力。2018年诺贝尔经济学奖获得者William D. Nordhaus在《计算过程》一文中提出:“算力是设备根据内部状态的改变,每秒可处理的信息数据量”。算力实现的核心是CPU、GPU、FPGA、ASIC等各类计算芯片,并由计算机、服务器、高性能计算集群和各类智能终端等承载,海量数据处理和各种数字化应用都离不开算力的加工和计算。算力数值越大代表综合计算能力越强。
早在2023年4月,由国家网信办发布《数字中国发展报告(2022年)》中就指出:我国算力基础设施规模加速提升,截至2022年底,我国数据中心机架总规模已超过650万标准机架,近5年年均增速超过30%,在用数据中心算力总规模超180EFlops,位居世界第二。而1EFlops约为8台神威·太湖之光超级计算机(峰值性能约125PFlops),或者25万台主流双路服务器,或者200万台主流笔记本的算力输出。
神威·太湖之光 图片来源:视觉中国
之后在9月举行的2023世界计算大会上,工业和信息化部总工程师赵志国指出,当前,以异构计算、智能计算、量子计算等为代表的先进计算已演进到质变的关键阶段。2022年,我国计算产业规模达2.6万亿元,近六年累计出货超过2091万台通用服务器、82万台AI服务器。
中国信息通信研究院在当月发布的《中国算力发展指数白皮书(2023年)》中指出,现在全球各国算力规模与经济发展水平密切相关,经济发展水平越高,算力规模越大。2022年算力规模前20的国家中有17个是全球排名前20的经济体,并且前五名排名一致,美国和中国依然分列前两位,同处于领跑者位置。
2022 年全球算力规模与GDP关系 图片来源:中国信息通信研究院
中国信息通信研究院测算结果显示,2022年美国、中国、欧洲、日本在全球算力规模中的份额分别为34%、33%、17%和4%,美国、中国占比与2021年持平,其中智能算力方面,中国、美国处于领先,按照近6年AI服务器算力总量估算,中国和美国算力全球占比分别为39%和31%。
2022年全球算力规模分布情况 图片来源:中国信息通信研究院
这是一个非常了不起的成就。因为算力快速发展并成为一种趋势,仅仅靠国家主导经济向智能化转型的命令是不够的。这样的需求背后是我国内生的经济转型,尤其是产业升级对于AI训练、机器学习等的相关需求作为支撑。这种规模的需求和增长速度意味着我们不仅追上了世界发展的潮流,更是在100多年来首次成为科技革命的弄潮儿。
算力为什么突然成为了关注的焦点?
算力这一概念走入多数人的视野的核心契机是2022年底到2023年初,AI大模型尤其是Chatgpt爆火带来的出圈效应。
在2022年底到2023年初,由绘画AI和大语言模型为代表的新一代AI颠覆了人们传统上对于AI只能在特定领域完成有限工作的认知。随后大模型的概念受到人们关注。
大模型是指包含超大规模参数的神经网络模型。新出现的AI大模型具有强大的表达能力和学习能力。同时,运行和训练这样的大模型需要成百上千个GPU、TPU等硬件连续运行几周到几个月,对超过100亿乃至千亿以上的参数进行数据处理。
而之所以需要那么多参数和硬件的核心原因是,科学家们发现,当模型参数超过100亿,训练量和参数超过一个阈值之后,模型的精确度会猛增。新模型对于很多问题的回答就更像个人了。而且,似乎参数量越大,训练越多,AI的表现就越好。
当训练和参数超过一个阈值AI出现了智能涌现现象 图片来源:“Emergent Abilities of Large Language Models”
这就让算力从衡量国家、企业发展的一个普通指标,变成了决定对未来至关重要的AI能力上限的硬性参数了。
而且随着多模态大模型的发展,对算力的需求似乎在短期内会越来越大。一般认为,最早出圈的GPT-3和3.5模型的参数量是1750亿个,GPT-4模型的参数量虽然一直秘而不宣,但是一般认为可能会在数千亿到万亿级别。而谷歌具身多模态语言模型PaLM-E,其参数量高达5620亿,远超GPT-3;而在2023年12月推出Gemini的参数更是高达1.6万亿个,训练所需算力是GPT-4的5倍。
可以说随着2022年人类进入大模型时代,算力正在成为我们这个时代未来发展最重要的基础设施之一。
中国算力将在逆境中成长
在2020年,美国宣布全面限制华为购买采用美国软件和技术生产的半导体,同时要求要为华为和海思生产代工前,都需要获得美国政府的许可证。很多人低估了这件事对于我们国家发展的影响,因为华为不仅仅是中国当时最大的手机制造商,它同时也是我国最大的AI芯片生产商。其在2019年发布,由台积电代工的昇腾910芯片时至今日依旧是中国最强的国产AI芯片之一。而且其巅峰之作,昇腾910在A100发售之前,一度可以争夺世界第一AI芯片桂冠。
2019年华为发布昇腾910芯片 图片来源:视觉中国
到了2022年10月,也就是AI大模型即将爆发的前夜,美国方面通过了《芯片法案》,首次提出禁止中国大陆进口A100和H100级别及以上的芯片。并在去年进一步限制了中国大陆进口A800、H800等高端AI芯片甚至4090游戏芯片,试图将中国算力发展尤其是AI大模型发展限制在一个相对较低的水平。美方为了实现相关目的,甚至不惜放弃长期利益,为中国半导体产业留下了一块巨大的市场空白。
为了应对相关挑战,我国算力发展规划政策相继出台,算力基础设施已成为AI行业亟需布局的资源。2023年2月,中共中央国务院印发《数字中国建设整体布局规划》,强调“促进东西部算力高效互补和协同联动”。2023年10月,工业和信息化部等六部门关于印发《算力基础设施高质量发展行动计划》的通知,明确到2025年,算力规模超过300EFlops,智能算力占比达到35%,东西部算力平衡协调发展。
同时各地瞄准算力赛道布局,相继出台多项政策举措大力支持算力产业发展。以深圳为例,2023年12月5日,深圳发布《深圳市算力基础设施高质量发展行动计划(2024-2025)》,提出20条重点任务,助力深圳打造“多元供给、强算赋能、泛在连接、安全融通”的中国算网城市标杆。全国上下已形成积极推动算力产业快速健康发展的良好局面。
国家超级计算深圳中心 图片来源:视觉中国
此外,作为重要数字技术设施,近年来我国数据中心市场规模不断增长。根据IDC数据显示,2022年中国数据中心服务市场规模达1293.5亿元人民币,同比增长12.7%,数据中心采购规模进一步提升。目前,全国8个国家算力枢纽节点建设已全部开工,10个国家数据中心集群同步布局。我国西部地区新开工建设的数据中心项目数量稳步增长,我国算力集聚效应初步显现。
在产业方面,国内自主研发也在加速。2023年,百度、华为、讯飞等公司基于自己现有的算力基础和技术推出了自己的大模型,抢占国内市场。包括华为、小米、VIVO、OPPO等品牌手机都开始实装手机本地大模型。
随着2023年下半年华为突破7nm制程芯片工艺量产和出货,旗下子品牌昇腾再次推出了新一代Altas 900 AI计算集群,并开始出售。相比于2019年的前代Altas 900集群,此次发售强调了其拥有支持超万亿参数大模型训练能力、优化了针对大模型训练的系统性优化和算力调度能力、进一步提高了其超高的可靠性以及提供了针对大模型推理部署的专用软件生态。
2022年7月华为Atlas900PoD的AI训练集群模型 图片来源:视觉中国
对于华为在算力方面的野心,去年9月华为副董事长、时任轮值董事长、CFO孟晚舟曾表示,人工智能的发展,算力是核心驱动力。华为致力于打造中国坚实的算力底座,为世界构建第二选择。
本文系观察者网独家稿件,未经授权,不得转载。