OpenAI让ChatGPT具备了五种不同语音的能力 - 彭博社

Rachel Metz

2023-09-25

人工智能初创公司 OpenAI 正在推出其ChatGPT应用的一个功能，让聊天机器人能够用自己的语音回答口头提问和命令。

在接下来的两周内，用户将能够在聊天机器人中选择一个声音应用，可以从五个名为“Juniper”、“Breeze”和“Ember”等的人物中选择。 ChatGPT将以该声音生成的文本的音频形式进行播放 — 例如，大声朗读一个由AI生成的睡前故事。该功能将提供给订阅OpenAI每月20美元的ChatGPT Plus服务和企业用户。

OpenAI于五月发布了其ChatGPT应用，并已经提供了语音转文本的功能，让用户可以与机器人交谈。添加音频回应功能可能会让人感觉正在进行更加人性化的对话。该公司希望这一新功能能够鼓励用户在移动应用上的使用，使其与谷歌的助手、苹果公司的Siri或亚马逊公司的Alexa等个人助手产品更加竞争。

用户可以要求程序在开车去主题公园的路上讲述迪士尼乐园的历史，或者在厨房里翻找时要求提供一份鸡尾酒配方。在测试该工具时，它成功地叙述了一个关于海星和芜菁的故事。然而，虽然ChatGPT可以为歌曲创作歌词，但该应用将拒绝演唱。

ChatGPT的声音听起来相当类似人类（尽管仔细听会发现有点机械单调）。OpenAI表示，他们与配音演员合作构建了支持该功能的文本转语音AI模型。

该公司还表示，在未来几周，付费用户和企业用户将能够访问一个针对GPT-4的功能 — 这是支持ChatGPT的AI模型之一 — 提交一张图片及相关问题的功能。例如，可以上传一张粉色太阳镜的图片，并要求聊天机器人建议搭配的服装，或者提交一个数学问题的图片并请求帮助解决。这一功能是OpenAI今年早些时候宣布的当揭示GPT-4时，可通过ChatGPT应用程序和网站访问。