有手机就能免费用上大模型,AI普惠还得看中国
guancha
文 观察者网 张广凯
2023年,是我们集体见证人类历史的一年。自ChatGPT横空出世以来,大模型对于人类社会的颠覆性变革有目共睹。但我们也必须承认,当下的大模型更多还局限于企业级用途,面向消费者的杀手级应用尚未诞生。
人人都能触手可及、使用便利的大模型,离我们还有多远?
其实,当时间来到2023年底,一个AI真正走进千家万户的方案已经初具雏形。
2023年12月29日-2024年1月4日,vivo在全国多地打造 “新年心愿 蓝心同行”线下主题活动。活动现场限时开启「蓝心许愿屋」,让用户可以通过生成式AI以“创作愿望”的方式近距离体验蓝心大模型。这也是第一次有厂商在线下举办AI大模型技术相关的体验活动。
蓝心大模型是vivo于2023年11月刚刚发布的自研大模型矩阵,也是vivo打造用之于民的普惠大模型的最新成果。除了在多项能力测试中成绩优异之外,蓝心大模型落地在手机产品上也代表了大模型发展的一个新方向,有望真正给用户带来一款便捷、好用的私人大模型助手。
触手可及的大模型,应该长什么样?
2023年11月1日,vivo正式发布了新一代手机操作系统OriginOS 4,其AI能力相较以往有了巨大提升,全新的智能助手蓝心小V成为最大的亮点之一。
以苹果Siri为代表的手机语音助手,早就不是什么新鲜事物,但是它们能够实现的功能、语音识别的准确率,以及对语言的深度理解都难以让人满意,以至于这些人工智能助手常常被调侃为“人工智障”。
如何才能做出一个真正聪明的AI助手?从蓝心小V身上,我们可以看到一部分答案。
大模型赋能,当然是这个时代的主旋律。与蓝心小V同时发布的,是vivo自研的蓝心大模型。
发布之初,蓝心大模型矩阵包含十亿、百亿、千亿三个参数量级,共5款自研大模型。其中1B(10亿参数)和7B(70亿参数)的蓝心大模型已经在vivo旗舰机型上实现了端侧化,70B(700亿参数)成为面向云端服务的主力模型。而参数量最大的蓝心大模型175B(1750亿参数),已经持平于外界普遍认为的ChatGPT-3.5参数量。
从实际表现来看,蓝心大模型在语言理解、文本创作等场景下能力非常优秀,中文语境能力一度在CEVAL、CMMLU等专业榜单上排名第一。
不过,仅仅做出一款业界领先的大模型,对消费者来说就够了吗?答案是否定的。
ChatGPT-3问世至今已经一年有余,形形色色的国产大模型也层出不穷,但是平心而论,这些大模型能够给普通人提供的服务仍然有限。甚至有大模型厂商直接表示,只做行业类服务,不会面向普通消费者。
究其原因,大模型的落地应用目前还面临两大难题。
首当其冲的,是贵。大模型训练有多烧钱,已经无需赘述。有报道指出,ChatGPT-3单次训练成本达到460万美元,每天的运营成本都要70万美元。vivo副总裁、OS产品副总裁、vivo AI全球研究院院长周围也曾经表述过,以vivo的用户体量,如果运营云端大模型,全年单单服务器成本可能就是十亿甚至百亿级别。
此外,大模型厂家无论是自行购置GPU进行训练,还是租用云服务器,费用都十分高昂。虽然很多大模型免费或者低价向普通用户开放,但是从盈利层面显然是不可持续的,需要企业级业务的补贴。
其次,对于普通用户来说,大模型往往也不是真的那么好用。
决定一款大模型性能的,除了算法之外,更重要的是数据和训练。对于通用大模型而言,虽然它们使用了全网海量数据进行训练,但是其输出结果也趋于泛化,未必符合用户的个性化需求。而网络数据的准确性难以保证,也会导致大模型输出结果的错误。
因此,企业级用户一般都需要使用专门数据来进一步训练模型。
那么对于个人用户来说,便宜和个性化,也是大模型落地最大的痛点。
以vivo为代表的手机厂商入局,则为此提供了一个解决方案。
那就是vivo发布的蓝心1B和7B大模型。
所谓端侧大模型,是直接部署在用户终端,也就是手机上的大模型。这种轻量化的大模型,可以直接使用手机处理器的算力进行运行,在大部分场景下不需要网络通信,飞行模式下也能用。
这样一来,厂商直接省掉了大模型运行中的服务器成本,而用户相当于在购买手机时就获得了大模型,后续使用成本为零。
端侧大模型另一个优势,是在未来或许能够真正成为个性化的用户私人助理。
“大模型能否记住用户的习惯,并提供更加个性化的服务?能否记住我们和大部分时间一起的共同经历,拥有共同的回忆,从而为用户带来温暖的陪伴?”vivo副总裁周围提出了这样一个问题。
一个真正的智能助手,应该是温暖的,而不是冰冷的;应该具有人格和记忆,与用户共享喜怒哀乐。想要实现这一点,大模型必须能够实时获得用户信息和行为习惯。
那么随之而来的问题是,用户个人信息如何保障?一个完全部署在手机上,无需将数据上传到服务器的大模型,无疑为隐私提供了最大的保护。
正是得益于这两大优势,端侧大模型已经成为2023年底行业中最火热的概念之一,有望让大模型快速走进千家万户。
以vivo为代表的中国手机厂商,正在大模型时代占据先机。
AI普惠,中国企业做对了什么?
国产大模型百花齐放的盛况,在一年前还是很多人不敢想象的。
2023年初曾有人断言,大模型领域的创业,ChatGPT已经做完了99%的工作,后来者只能基于ChatGPT做一些应用层面的开发。
但是事实证明,中国企业在大模型领域也有长期、深厚的积累。
vivo为何能够快速推出业界领先的蓝心大模型?事实上,vivo对于AI的研究布局已久。
早在2017年,vivo就组建了Al全球研究院,是首批设立专攻人工智能方向研究院的中国手机公司之一。自那时起,vivo一直维持着1000人左右的专业人工智能团队,累计在顶级期刊发表了70多篇算法领域的高水平论文。
除了坚定的资本投入,vivo还做对了一件事,就是拥抱开源。目前,vivo已经将7B参数量级的蓝心大模型面向全行业进行了开源,让更多的中小开发者可以“拥抱”大模型。
周围在介绍蓝心大模型时谈道,真正好的自研大模型需要具备5点特质,分别是大而全、算法强、真安全、自进化、广开源。
ChatGPT诞生之初的惊艳,一度让外界认为它就是大模型的终极形态。不过冷静下来之后,人们很快发现,ChatGPT仍然处于一个孩童阶段,虽然具备了基础的逻辑能力,但是仍然需要学习更多的专业知识才能长大。
因此,在ChatGPT之外,以Meta为代表的开源路线也逐渐显示出自己的优势。大模型不是闭门造车,能够把更多开发者拉进朋友圈,更有利于发挥人类集体的智慧来帮助AI成长。
vivo是开源路线的受益者,也是贡献者。
目前,vivo已经正式开源了蓝心大模型的70B版本,为了方便开发者使用,还推出了蓝心大模型开发套件 Bluekit。中小开发者可以直接调用大模型的端侧推理能力,真正实现了大模型的开箱即用;对于希望进行微调的开发者,vivo 提供模型参数热插拔机制,通过系统级计算调度,将开发者模型进行组合推理,帮助构建高自由度的定制化模型。
此外,vivo的自然语言对话机器人蓝心千询,将以手机公版app的形式上线各大手机应用市场,不仅vivo手机用户可以使用,所有安卓和ios的用户都可以在应用市场下载。
不仅要让消费者用上更便宜、好用的大模型,同样也要让开发者触手可及,为整个中国人工智能产业的发展赋能,这才是AI普惠更深层的意义。
当更多的头部企业加入开源生态建设,我们也有理由对中国大模型的后来居上充满信心。