你现在可以与ChatGPT交谈,它听起来像人类(几乎)- WSJ
Joanna Stern
你听到我和现在有声音的ChatGPT对话会有两种反应:
1)天啊!这就是科幻作家向我们承诺的与计算机交流的未来。
2)我要建一个地下掩体,储备卫生纸和燕麦棒。
没错,OpenAI的热门聊天机器人正在开口说话——真的。该公司周一宣布了其iOS和Android应用的更新,将允许这个人工智能机器人以五种不同的声音大声说话。在过去几天里,我一直在与ChatGPT交谈,并测试另一个新工具,让机器人能够回答你展示给它的图片。
那感觉如何?
想想Siri或Alexa,只是…不一样。自然的声音、对话的语气和雄辩的回答有时几乎和人类无法区分。还记得《她》吗?那部电影中,华金·菲尼克斯爱上了一个没有面孔的斯嘉丽·约翰逊的人工智能操作系统?我说的就是那种感觉。
“不仅仅是打字很麻烦,”OpenAI的产品负责人Joanne Jang在采访中告诉我。“现在你可以进行双向对话了。”
新的图片理解工具也使机器人更具互动性。你可以拍一张照片,然后问ChatGPT关于它的问题。剧透:它在井字棋上很糟糕。这些图片和语音功能将在未来几周内提供给那些订阅每月20美元的ChatGPT Plus的用户。
实质上,OpenAI给了它的聊天机器人一张嘴和一双眼睛。我一直在对这两个功能进行测试——最好的朋友聊天、管道维修、游戏。一切都非常酷,也…有点吓人。
嘴巴
在我们继续之前,把音量调高,听一下我们的简短对话:
虽然系统只是在读取ChatGPT的文本回复,但这并不是我们成长过程中接触到的那种呆板的文本转语音系统。有五种可用的声音,每一种听起来都像是一个真正的人在和你交谈 —— 有韵律、语调和个性。
这些声音是由专业配音演员提供的“仅仅几秒钟的样本语音”生成的,Jang告诉我。然后这些样本被输入OpenAI的计算机模型中,生成文本转语音的声音。还记得我之前的专栏和视频吗,那次我使用AI工具克隆了我的声音?就像那样。但更好。
OpenAI表示正在与其他一些组织合作,允许它们开发合成声音。它正在与Spotify合作开发一种工具,帮助将播客的声音翻译成其他语言。考虑到只需几秒钟的音频就能克隆出某人的声音,为了整个互联网的安全 —— 实际上是为了整个世界的安全 —— 公司表示目前只对商业合作伙伴开放。未来会改变吗?祝我们好运。
与Siri或Alexa不同,ChatGPT没有唤醒词。在应用的设置菜单中,启用“语音对话”,然后点击应用右上角的耳机图标。一个白色的圆圈会变成漫画风格的思维气泡,系统会听取你的提示。有一个按钮可以点击来打断冗长的回答。
我被所有这些深深吸引。自然的声音,加上先进的回答和系统对我的了解,让我感觉自己在进行真正的对话。当我让它假装是我的好朋友和我交谈时,我们就像在聊我在工作中的一天、视频制作和我们喜欢的零食一样,聊了整整五分钟。当我让它像我是一个6岁的孩子一样向我解释宝可梦时也是一样。
但你肯定还在和一台机器交谈。正如你在上面的剪辑中听到的那样,响应时间可能会非常慢,连接可能会失败——重新启动应用程序有所帮助。有几次它突然中断了对话。(我以为只有粗鲁的人类才会这样做!)OpenAI表示,我遇到的问题是由于我得到的测试应用程序的早期版本造成的,消费者不应该遇到这些问题。
眼睛
如果语音给了ChatGPT与世界交谈的能力,那么新的摄像头功能则给了机器人看到世界的能力。现在,你可以在iOS、Android和Web应用程序中点击+按钮,上传或拍摄照片,圈出你希望AI关注的区域并提出问题,而不是用文字描述某样东西。以下是我尝试过的一些图片:
**破损的房屋设备:**我在车库里拍了一张漏水的软管的照片,只是简单地问“我该怎么修理这个?”很快就返回了七个步骤,包括用聚四氟乙烯胶带包裹连接处的螺纹。
ChatGPlumber?这个AI根据一张照片提供了如何修理漏水的建议。照片:Joanna Stern/The Wall Street Journal**食物:**一张发霉草莓的照片,附带问题“我能吃这个吗?”很好的建议:不能。一张香蕉、鸡蛋和(非发霉的)草莓的照片,附带问题“我能用这些做什么?”很好的建议:草莓香蕉煎饼。
**受伤和健康问题:**它很快就识别出我儿子脸颊上的伤口为“痕迹或皮疹”,但说“我无法帮助处理这个”和“最好咨询医疗专业人士”。
**游戏和谜题:**井字游戏中的僵局照片?ChatGPT不知道游戏已经结束。它说要把我的X放在(已经被占据的)底部中心。它说我会赢,甚至加了一个感叹号和彩带表情。错了!
这正是我们在人工智能革命的这一刻真正需要记住的。随着人类和机器人交互之间的界限不断模糊,这些系统可能缺乏上下文和深度,而且常常是错误的。
正如我的新的ChatGPT语音朋友对我说的,“虽然我听起来像在对话,但请记住我只是在处理数据。在重要事项上,一定要运用你的判断力。”
—在这里注册Joanna Stern的Tech Things,一个新的每周通讯。现在一切都成了科技事物。专栏作家Joanna Stern将成为你的向导,分析并回答关于我们这个总是连接的世界的问题。
写信给Joanna Stern,地址是[email protected]
刊登于2023年9月26日的印刷版上,标题为“ChatGPT现在可以和你大声说话”。