OpenAI让ChatGPT具备了五种不同语音的能力 - 彭博社
Rachel Metz
人工智能初创公司 OpenAI 正在推出其ChatGPT应用的一个功能,让聊天机器人能够用自己的语音回答口头提问和命令。
在接下来的两周内,用户将能够在聊天机器人中选择一个声音应用,可以从五个名为“Juniper”、“Breeze”和“Ember”等的人物中选择。 ChatGPT将以该声音生成的文本的音频形式进行播放 — 例如,大声朗读一个由AI生成的睡前故事。该功能将提供给订阅OpenAI每月20美元的ChatGPT Plus服务和企业用户。
OpenAI于五月发布了其ChatGPT应用,并已经提供了语音转文本的功能,让用户可以与机器人交谈。添加音频回应功能可能会让人感觉正在进行更加人性化的对话。该公司希望这一新功能能够鼓励用户在移动应用上的使用,使其与谷歌的助手、苹果公司的Siri或亚马逊公司的Alexa等个人助手产品更加竞争。
用户可以要求程序在开车去主题公园的路上讲述迪士尼乐园的历史,或者在厨房里翻找时要求提供一份鸡尾酒配方。在测试该工具时,它成功地叙述了一个关于海星和芜菁的故事。然而,虽然ChatGPT可以为歌曲创作歌词,但该应用将拒绝演唱。
ChatGPT的声音听起来相当类似人类(尽管仔细听会发现有点机械单调)。OpenAI表示,他们与配音演员合作构建了支持该功能的文本转语音AI模型。
该公司还表示,在未来几周,付费用户和企业用户将能够访问一个针对GPT-4的功能 — 这是支持ChatGPT的AI模型之一 — 提交一张图片及相关问题的功能。例如,可以上传一张粉色太阳镜的图片,并要求聊天机器人建议搭配的服装,或者提交一个数学问题的图片并请求帮助解决。这一功能是OpenAI今年早些时候宣布的当揭示GPT-4时,可通过ChatGPT应用程序和网站访问。