谷歌在搜索中注入人工智能,带来“全新改进”的体验 - 彭博社
Davey Alba, Julia Love
谷歌正在推出一种新的AI增强搜索体验,改变了“谷歌”这个词的含义。
摄影师:Jeff Chiu/AP照片Noam Shazeer和Daniel de Freitas Adiwardana
摄影师:Winni Wintermeyer/The Washington Post/Getty Images近两年来,谷歌一直在与OpenAI等公司竞争,以将生成式人工智能引入公众视野,这种人工智能可以以对话方式回答复杂问题,以一种大多数消费者实际会采用的方式。周二,谷歌向竞争对手发出明确信号,表明它无意失去作为全球最受欢迎搜索引擎的领先地位。
过去二十年来,“谷歌"这个行为一直等同于搜索,现在将通过Alphabet Inc.强大的AI模型Gemini技术得到强化,该公司在加利福尼亚州山景城举办的年度开发者大会上宣布。
“谷歌搜索是以人类好奇心为尺度的生成式人工智能,”首席执行官桑达尔·皮查伊在公司的I/O峰会上宣布新功能时说。
桑达尔·皮查伊正在用人工智能强化谷歌搜索引擎。摄影师:Andrej Sokolow/picture-alliance/dpa/AP在现场观众面前,谷歌推出了皮查称之为“全新改版的搜索体验”,这将在本周推出给所有美国用户,而由新的Gemini技术支持的搜索将“很快”推向其他国家。
“我们看到创作者、开发者、初创公司以及每个人面前有很多机会,”皮查在活动前与记者通话时说。
谷歌搜索中最大的单一变化是,现在一些搜索结果将配有“AI概述”,这是一个更具叙事性的回应,使人们免去了点击各种链接的任务。
一个由人工智能驱动的面板将出现在人们查询的下方,显示从互联网上的谷歌搜索结果中提取的摘要信息。谷歌表示,它还将推出一个由人工智能组织的页面,按主题分组结果,或者提供比如为一周制定饮食计划或寻找餐厅庆祝周年纪念日等特定任务而求助于谷歌的人的逐日计划。谷歌表示,对于某些敏感查询,比如搜索医疗信息或自残,它不会触发AI概述。
谷歌的新AI驱动搜索体验。来源:谷歌1998年成立后不久,谷歌超越雅虎,成为明显的全球最受欢迎搜索引擎,这是其算法的结果,当时比其他任何东西都更快更准确。其主导地位如此牢不可破,以至于它成为一起联邦反垄断诉讼的主题。(预计今年晚些时候将宣判。)
在线搜索的性质正在根本性地改变 — 谷歌的竞争对手越来越多地进入其领域。这家搜索巨头面临着来自OpenAI和Anthropic等公司的巨大压力,它们的人工智能聊天机器人ChatGPT和Claude易于使用,并已被广泛采纳 — 威胁到谷歌在搜索领域的领先地位,危及其整个商业模式。
在周一发布的战略性时机公告中,由微软公司支持的OpenAI推出了一款更快更便宜的AI模型,名为GPT-4o,将为其流行的聊天机器人提供动力。这款新的AI模型将让人们与ChatGPT交谈或向其展示图像,并且OpenAI表示它可以在毫秒内做出回应。当谷歌在周二发布其最新产品时,它面临着一个棘手的平衡行为:展示自己并没有落后于OpenAI,同时又不破坏搜索广告业务,这仍然是其命脉。
“通过展示其最新模型以及它们如何为具有强大消费者群体的现有产品提供动力,谷歌正在展示自己如何有效地区别于竞争对手,” Emarketer的分析师Jacob Bourne说道。“为了保持竞争优势并满足投资者,谷歌需要专注于将其人工智能创新转化为规模化的盈利产品和服务。”
如果去年谷歌展示了愿意在其主要产品和服务中尝试生成式人工智能功能,那么今年公司正在全力以赴,在其标志性平台上进行根本性和明显的变革。
转变给谷歌核心搜索业务的经济带来了挑战,去年该业务为搜索广告带来了超过1750亿美元的收入。投资者指出,提供生成式人工智能搜索结果将需要比生成链接列表更多的计算能力,可能会侵蚀谷歌极其利润丰厚的搜索机器的利润率。在上周接受彭博采访时,谷歌搜索副总裁丽兹·里德表示,公司在降低生成式人工智能搜索成本方面取得了进展。她表示,公司没有计划让基于人工智能的新增功能与订阅挂钩,这一点已经被媒体报道过。
丽兹·里德在5月14日于山景城举行的谷歌I/O活动上发言。摄影师:杰夫·丘/AP照片通过向其搜索引擎引入更多生成式人工智能,谷歌希望减少用户查找所需信息所需的时间和精力负担,里德表示。
“搜索是一个非常强大的工具。但有很多时候你必须在搜索中做很多艰苦的工作,”里德说。“我们如何能够帮你省去搜索的艰苦工作,让你可以专注于完成任务?”里德表示,新的基于人工智能的谷歌搜索将能够处理数十亿个查询。
但谷歌也必须小心不要搅动局面太多。如果人工智能概述完全回答了用户的问题,人们可能会点击更少的广告。依赖搜索巨头获取流量的新闻网站和其他网站的生态系统也可能因为谷歌的变化而看到访问者减少。里德试图向广告商和发布商展现出一种平静的氛围。她表示,广告将继续出现在谷歌搜索结果的专用位置中,并通过标签区分赞助项目和有机结果。与此同时,公司的测试显示,生成式人工智能搜索是用户访问其他网站的一个起点,而不是终点,她补充道。
Reid拒绝透露用户会多频繁看到这些概述,但表示谷歌公司将专注于在传统搜索体验之上提供“有意义的价值”时提供它们。
然而,特别是出版商持谨慎态度。帮助数字创作者建立品牌的公司Raptive估计,如果谷歌广泛推出“搜索生成体验”(SGE),那么前往出版商网站的搜索流量将减少25%,就像谷歌周二推出的生成式AI搜索引擎一样。“通过构建一个旨在将更多流量留在谷歌内部的体验,将有更少的人访问个人网站,创作者的收入将受到影响,” Raptive的首席创新官Marc McCollum在一封电子邮件中写道。“因此,谷歌将获得份额和收入,而创造了构建SGE所使用的内容的人们将受到折磨。”
谷歌位于加利福尼亚州山景城的Bay View校园。谷歌与搜索已经超过两十年。摄影师:David Paul Morris/Bloomberg谷歌高管强调,在人工智能新时代,搜索仍将是核心。例如,Reid描述了一个即将推出的“视觉搜索”功能,该功能将允许人们在谷歌的自愿参与搜索实验中拍摄一个故障的小工具的视频,比如唱片播放机,并要求谷歌提供AI概述来帮助他们解决问题。
在周一与记者通话时,谷歌AI实验室DeepMind的首席执行官Demis Hassabis更进一步展示了Gemini对查询的响应能力。Hassabis展示了Project Astra,这是一个能够实时处理视频并回应的AI助手的原型。在一个预先录制的视频演示中,一名员工在办公室里走动,助手利用手机摄像头“看到”,回答了有关场景中有什么的问题。该程序正确回答了一个关于办公室位于伦敦哪个街区的问题,基于窗外的景色,并告诉员工她把眼镜放在哪里了。Hassabis表示该视频是“一次拍摄,实时捕捉的。”
“在任何时刻,我们都在处理不同的感官信息流,理解并做出决策,”Hassabis在Project Astra演示中说道。“想象一下,代理可以看到和听到我们所看到和听到的内容,以更好地理解我们所处的环境,并在对话中快速做出回应,使互动的节奏和质量感觉更加自然。” Pichai后来澄清说,Google“有志”地希望将Project Astra的一些功能带入公司的核心产品,特别是Gemini,在今年下半年。
为了在人工智能领域不断取得进展,Google还不得不更新其一套AI模型,并且该公司在这方面分享了更多进展。它宣布了Gemini 1.5 Flash,Google表示这是通过其应用程序编程接口(API)提供的最快的AI模型,通常由程序员用于自动化高频任务,如总结文本、给图像或视频加标题,或从表格中提取数据。
它还揭示了Gemini Nano的更新,Google最小的AI模型,扩展到包括图像在内的文本输入;推出了一个更新版本的其开放模型系列Gemini 2,具有更高的效率;并表示该公司在其强大的AI模型Gemini 1.5 Pro上取得了更好的基准。
周二,Google确认开发人员可以使用Gemini 1.5 Pro同时处理更多文本、视频和音频 — 高达2百万个“标记”,或内容片段。这相当于约2小时的视频、22小时的音频或超过140万字。Google表示,这种处理量远远超过其他竞争对手的AI模型,包括OpenAI。
谷歌还突出了其生成式媒体工具和服务,介绍了新模型并更新了现有模型。周二,它宣布推出了一个名为Veo的新视频生成模型,生成高质量的视频,时长超过一分钟 — 这是对OpenAI的视频生成工具Sora的回应。谷歌正在让创作者注册加入等待测试该产品的名单,并表示将在“未来”将Veo的部分功能引入YouTube Shorts和其他视频产品中。
谷歌宣布了Imagen 3的更新,这是其文本转图像AI模型的第三个版本,其中包括减少图像失真等改进。此外,谷歌还在继续尝试使用名为Lyria的AI生成音乐服务,以及一套名为音乐AI沙盒的音乐AI工具。
AI优势的很大一部分取决于拥有能够处理所有正在处理的数据的强大半导体。为此,谷歌宣布推出了面向数据中心的自家设计芯片的新版本,即其TPU(张量处理单元)的第六个版本。谷歌表示,最新版本将比其前身快4.7倍,具有更多内存访问权限,并具有更快的与其他芯片连接的功能。
在人们对公司应该如何处理AI生成内容的浪潮以及对版权问题的担忧不断增长的情况下,谷歌表示将推出由Gemini和视频模型Veo创建的水印系统。该系统名为SynthID,将不可察觉的数字标签嵌入AI生成的图像、音频、视频甚至文本中,以便人们可以追踪特定媒体内容的来源。谷歌计划在今年夏天以开源形式发布这项技术,以便外部开发人员使用。
谷歌还试图将Gemini描绘为一个强大的代理,可以在用户日常生活中提供帮助。为了每月支付20美元购买谷歌的AI高级订阅计划的用户将获得Gemini的一个版本,可以一次处理100万个标记 — 或者大约70万个单词,谷歌表示这是目前向广大公众提供的任何模型中最大的。公司表示,这意味着人们可以要求AI模型为他们消化大量数据,比如总结100封电子邮件。一项名为Gemini Live的新功能将让谷歌的高级订阅用户在其移动设备上自然地与公司的AI软件交流,甚至可以在回答过程中暂停或打断Gemini Live并提出问题。
谷歌表示,人们的文件将保持私密,不会用于训练AI模型。订阅用户将能够创建Gemini的定制版本,称为Gems,以实现特定目的,比如指导他们的跑步。
Character.AI的联合创始人将加入谷歌,这是一项更大的交易,允许这家搜索巨头获得这家人工智能初创公司的技术许可。
Character.AI是一家以能够模仿任何人或任何事物的聊天机器人而闻名的初创公司,周五在一篇博客文章中宣布了这一消息。创始人Noam Shazeer和Daniel De Freitas以及其研究团队的一些成员将加入Alphabet Inc.的谷歌,该公司表示。这家初创公司的新临时首席执行官将是Dominic Perella,他曾担任Character.AI的总法律顾问。