有手机就能免费用上大模型，AI普惠还得看中国

guancha

2024-01-04

文观察者网张广凯

2023年，是我们集体见证人类历史的一年。自ChatGPT横空出世以来，大模型对于人类社会的颠覆性变革有目共睹。但我们也必须承认，当下的大模型更多还局限于企业级用途，面向消费者的杀手级应用尚未诞生。

人人都能触手可及、使用便利的大模型，离我们还有多远？

其实，当时间来到2023年底，一个AI真正走进千家万户的方案已经初具雏形。

2023年12月29日-2024年1月4日，vivo在全国多地打造 “新年心愿蓝心同行”线下主题活动。活动现场限时开启「蓝心许愿屋」，让用户可以通过生成式AI以“创作愿望”的方式近距离体验蓝心大模型。这也是第一次有厂商在线下举办AI大模型技术相关的体验活动。

蓝心大模型是vivo于2023年11月刚刚发布的自研大模型矩阵，也是vivo打造用之于民的普惠大模型的最新成果。除了在多项能力测试中成绩优异之外，蓝心大模型落地在手机产品上也代表了大模型发展的一个新方向，有望真正给用户带来一款便捷、好用的私人大模型助手。

触手可及的大模型，应该长什么样？

2023年11月1日，vivo正式发布了新一代手机操作系统OriginOS 4，其AI能力相较以往有了巨大提升，全新的智能助手蓝心小V成为最大的亮点之一。

以苹果Siri为代表的手机语音助手，早就不是什么新鲜事物，但是它们能够实现的功能、语音识别的准确率，以及对语言的深度理解都难以让人满意，以至于这些人工智能助手常常被调侃为“人工智障”。

如何才能做出一个真正聪明的AI助手？从蓝心小V身上，我们可以看到一部分答案。

大模型赋能，当然是这个时代的主旋律。与蓝心小V同时发布的，是vivo自研的蓝心大模型。

发布之初，蓝心大模型矩阵包含十亿、百亿、千亿三个参数量级，共5款自研大模型。其中1B（10亿参数）和7B（70亿参数）的蓝心大模型已经在vivo旗舰机型上实现了端侧化，70B（700亿参数）成为面向云端服务的主力模型。而参数量最大的蓝心大模型175B（1750亿参数），已经持平于外界普遍认为的ChatGPT-3.5参数量。

从实际表现来看，蓝心大模型在语言理解、文本创作等场景下能力非常优秀，中文语境能力一度在CEVAL、CMMLU等专业榜单上排名第一。

不过，仅仅做出一款业界领先的大模型，对消费者来说就够了吗？答案是否定的。

ChatGPT-3问世至今已经一年有余，形形色色的国产大模型也层出不穷，但是平心而论，这些大模型能够给普通人提供的服务仍然有限。甚至有大模型厂商直接表示，只做行业类服务，不会面向普通消费者。

究其原因，大模型的落地应用目前还面临两大难题。

首当其冲的，是贵。大模型训练有多烧钱，已经无需赘述。有报道指出，ChatGPT-3单次训练成本达到460万美元，每天的运营成本都要70万美元。vivo副总裁、OS产品副总裁、vivo AI全球研究院院长周围也曾经表述过，以vivo的用户体量，如果运营云端大模型，全年单单服务器成本可能就是十亿甚至百亿级别。

此外，大模型厂家无论是自行购置GPU进行训练，还是租用云服务器，费用都十分高昂。虽然很多大模型免费或者低价向普通用户开放，但是从盈利层面显然是不可持续的，需要企业级业务的补贴。

其次，对于普通用户来说，大模型往往也不是真的那么好用。

决定一款大模型性能的，除了算法之外，更重要的是数据和训练。对于通用大模型而言，虽然它们使用了全网海量数据进行训练，但是其输出结果也趋于泛化，未必符合用户的个性化需求。而网络数据的准确性难以保证，也会导致大模型输出结果的错误。

因此，企业级用户一般都需要使用专门数据来进一步训练模型。

那么对于个人用户来说，便宜和个性化，也是大模型落地最大的痛点。

以vivo为代表的手机厂商入局，则为此提供了一个解决方案。

那就是vivo发布的蓝心1B和7B大模型。

所谓端侧大模型，是直接部署在用户终端，也就是手机上的大模型。这种轻量化的大模型，可以直接使用手机处理器的算力进行运行，在大部分场景下不需要网络通信，飞行模式下也能用。

这样一来，厂商直接省掉了大模型运行中的服务器成本，而用户相当于在购买手机时就获得了大模型，后续使用成本为零。

端侧大模型另一个优势，是在未来或许能够真正成为个性化的用户私人助理。

“大模型能否记住用户的习惯，并提供更加个性化的服务？能否记住我们和大部分时间一起的共同经历，拥有共同的回忆，从而为用户带来温暖的陪伴？”vivo副总裁周围提出了这样一个问题。

一个真正的智能助手，应该是温暖的，而不是冰冷的；应该具有人格和记忆，与用户共享喜怒哀乐。想要实现这一点，大模型必须能够实时获得用户信息和行为习惯。

那么随之而来的问题是，用户个人信息如何保障？一个完全部署在手机上，无需将数据上传到服务器的大模型，无疑为隐私提供了最大的保护。

正是得益于这两大优势，端侧大模型已经成为2023年底行业中最火热的概念之一，有望让大模型快速走进千家万户。

以vivo为代表的中国手机厂商，正在大模型时代占据先机。

AI普惠，中国企业做对了什么？

国产大模型百花齐放的盛况，在一年前还是很多人不敢想象的。

2023年初曾有人断言，大模型领域的创业，ChatGPT已经做完了99%的工作，后来者只能基于ChatGPT做一些应用层面的开发。

但是事实证明，中国企业在大模型领域也有长期、深厚的积累。

vivo为何能够快速推出业界领先的蓝心大模型？事实上，vivo对于AI的研究布局已久。

早在2017年，vivo就组建了Al全球研究院，是首批设立专攻人工智能方向研究院的中国手机公司之一。自那时起，vivo一直维持着1000人左右的专业人工智能团队，累计在顶级期刊发表了70多篇算法领域的高水平论文。

除了坚定的资本投入，vivo还做对了一件事，就是拥抱开源。目前，vivo已经将7B参数量级的蓝心大模型面向全行业进行了开源，让更多的中小开发者可以“拥抱”大模型。

周围在介绍蓝心大模型时谈道，真正好的自研大模型需要具备5点特质，分别是大而全、算法强、真安全、自进化、广开源。

ChatGPT诞生之初的惊艳，一度让外界认为它就是大模型的终极形态。不过冷静下来之后，人们很快发现，ChatGPT仍然处于一个孩童阶段，虽然具备了基础的逻辑能力，但是仍然需要学习更多的专业知识才能长大。

因此，在ChatGPT之外，以Meta为代表的开源路线也逐渐显示出自己的优势。大模型不是闭门造车，能够把更多开发者拉进朋友圈，更有利于发挥人类集体的智慧来帮助AI成长。

vivo是开源路线的受益者，也是贡献者。

目前，vivo已经正式开源了蓝心大模型的70B版本，为了方便开发者使用，还推出了蓝心大模型开发套件 Bluekit。中小开发者可以直接调用大模型的端侧推理能力，真正实现了大模型的开箱即用；对于希望进行微调的开发者，vivo 提供模型参数热插拔机制，通过系统级计算调度，将开发者模型进行组合推理，帮助构建高自由度的定制化模型。

此外，vivo的自然语言对话机器人蓝心千询，将以手机公版app的形式上线各大手机应用市场，不仅vivo手机用户可以使用，所有安卓和ios的用户都可以在应用市场下载。

不仅要让消费者用上更便宜、好用的大模型，同样也要让开发者触手可及，为整个中国人工智能产业的发展赋能，这才是AI普惠更深层的意义。

当更多的头部企业加入开源生态建设，我们也有理由对中国大模型的后来居上充满信心。