字母表公司推出增强版AI搜索和聊天机器人,竞争加剧 | 路透社
Max A. Cherney,Jeffrey Dastin
山景城,加利福尼亚州,5月14日(路透社) - 谷歌母公司Alphabet (GOOGL.O)周二展示了它如何在各个业务中构建人工智能,包括增强版的Gemini聊天机器人和对其珍贵搜索引擎的改进,因为它在与AI竞争对手的竞赛中加速前进。一系列公告突显了谷歌自微软支持的 (MSFT.O) OpenAI在2022年推出ChatGPT以来,努力刷新其产品的决心,这一举动威胁到了现有公司在在线搜索和AI领域的长期统治。谷歌最新的举措之一是其Gemini 1.5 AI模型家族中的一个名为Flash的新增功能,它运行更快且成本更低;一个名为Project Astra的原型,可以实时与用户讨论他们智能手机相机捕捉到的任何内容;以及根据AI生成的标题分类的搜索结果。
当被问及AI更新是否会危及谷歌的盈利业务时,Alphabet首席执行官桑达尔·皮查伊告诉记者:“这是一个增长和机会的时刻。”
在加利福尼亚州山景城的谷歌年度I/O开发者大会上的产品展示,紧随其后的是竞争对手OpenAI周一的简短展示。OpenAI演示了ChatGPT如何以类人语调对任何书面或视觉提示进行回答。该初创公司的首席执行官山姆·阿尔特曼写道,OpenAI提供的软件“感觉像电影中的AI.“谷歌的新闻有时覆盖了类似的领域,强调了两家人工智能开发者之间的激烈竞争。
例如,Alphabet的人工智能部门谷歌DeepMind一直在努力构建能够为消费者执行日常任务的技术。早期成果体现在项目Astra上,这是一种可以使用智能手机摄像头并对周围世界得出结论的工具。
在谷歌I/O期间展示的演示视频中,一位用户使用它来识别一个演讲者并找到他们在房间另一部分遗留的眼镜。该公司还暗示如何将项目Astra与其称之为Gemini Live的技术配对,这可能是一种比过去的谷歌助手更自然的语音和文本助手。
谷歌DeepMind的首席执行官Demis Hassabis谈到项目Astra的工作时表示:“我们希望构建一个真正能在日常生活中提供帮助的通用人工智能代理。”
谷歌展示其如何与竞争对手对抗的另一个领域是视频生成。该公司推出了Veo,这是一种能够生成超过一分钟的1080p分辨率视频的人工智能模型,向获得批准的创作者提供预览,包括电影制作人唐纳德·格洛弗。OpenAI也在好莱坞高管中推广自己的电影创作软件,令创意产业既兴奋又担忧。谷歌还宣布对其Gemini Pro 1.5模型进行了改进,该模型能够理解大量数据。周二,它表示将这一数量翻倍,达到200万个标记,这意味着人工智能在处理数千页文本或超过一小时的视频时,可能能够回答问题。
谷歌和字母表的首席执行官桑达尔·皮查伊在法国巴黎谷歌总部为一个专注于人工智能(AI)领域的新中心的揭幕仪式上发表讲话,时间是2024年2月15日。路透社/贡萨洛·丰特斯/档案照片专业版 - 提供高达100万个标记或数据片段的提示大小 - 也将向谷歌的Gemini高级服务的订阅者提供。
字母表的股票在周二下午上涨了1%,达到172.59美元。
新芯片,新搜索
谷歌还阐明了其通过新计算芯片为AI提供动力并改进其同名搜索引擎的努力。
该公司宣布了一款第六代张量处理单元(TPU),旨在为其及其谷歌云客户提供一个替代行业巨头英伟达的(NVDA.O)强大处理器的选择。谷歌表示,这款新芯片将在2024年底向其云客户提供。与此同时,对于使用英语浏览网络的美国谷歌搜索用户,该公司表示,它将很快利用AI帮助组织关于餐饮、食谱的搜索结果,最终还包括电影、书籍和其他内容。
此外,对于谷歌搜索,该公司本周将在美国向所有用户推出AI概述,此前经过了自去年I/O活动以来的长时间公共测试。该功能使用生成性AI合成信息,并回答网络上没有简单答案的更复杂查询。
分析师雅各布·博恩(Jacob Bourne)表示:“本周的AI概述发布会将是谷歌如何调整其搜索产品以满足生成AI时代需求的一个指标。”
他补充道:“为了保持竞争优势并满足投资者,谷歌需要专注于将其AI创新转化为大规模的盈利产品和服务。”
该公司表示,广告将继续在谷歌网页的各个位置展示,AI概述将在年底前向超过十亿人推出。
字母表公司在2023年发布了3074亿美元的收入,其中大部分来自谷歌搜索和其他业务的广告。
该公司还展示了一项实验,允许用户向他们上传到谷歌搜索的视频提问,就像今天对图像所做的那样。该公司演示了这如何帮助诊断损坏的唱片播放器的问题。
科技汇总通讯将最新的新闻和趋势直接送到您的收件箱。请在 这里 注册。