AI幻觉困扰聊天机器人可能具有实用性 - 彭博社
Austin Carr
插图:彭博商业周刊的帕特里克·凯尔设计师Colin Dunn喜欢当像Midjourney和OpenAI的Dall-E这样的人工智能图像生成服务似乎出错并产生一些随机的东西,比如当它们对一个关于一群人一起走路的图像的请求做出回应时,却呈现出一个单独的人物向远处走去。这让Dunn想起了和同事一起尝试一堆奇怪想法,然后偶然发现正确的那个。
Dunn的创业公司,Visual Electric Co.,开发了一种新颖的网络界面来利用这一过程。文本到图像生成器通常会在聊天窗口中输出一次性图像,但在Dunn的应用中,输出被保存在行中,并排在它们修改的图像旁边或下方,形成了缩略图画廊。结果是一堆草稿,让用户根据人工智能如何解释他们的连续请求来探索各种创意想法,无论是好是坏。
Visual Electric的人工智能图像编辑器。来源:Visual Electric这个工作流程旨在激发“杂乱、混乱的探索”,Dunn说,他曾是Dropbox和Facebook的设计师,他位于加利福尼亚索萨利托的创业公司得到了Sequoia Capital的支持。他的公司不太关注以尽可能少的点击次数达到预期结果,而是让人工智能以出人意料的方式自由奔放。有工具可以自动重写更不寻常的描述,用心情改变美学,调整计算机解释你的话的自由度。
换句话说,Visual Electric的目标之一是鼓励“幻觉”,这是AI系统在其训练数据中纠缠并编造东西的伪科学术语。工程师们在ChatGPT于2022年底公开发布之前就一直在努力阻止聊天机器人产生幻觉,但聊天机器人和其他类似的系统仍然倾向于在回答用户查询时混入虚假的“事实”。例如,当被问及通货膨胀时,Google的Bard发明了一系列听起来真实的经济书籍,包括虚假摘要。在整合OpenAI技术后,必应参与了一些臭名昭著的交流,威胁要勒索并向早期评论者表白爱意。这种逼真而不可预测的回复不仅给人留下了机器人有自己思想的印象,而且给人以它们已经失去思想的印象。
如果人们要依赖像驱动ChatGPT的大型语言模型进行在线搜索、写作或其他应用,这种幻觉可能成为一个无法接受的问题。随着公众在2023年对人工智能感到恐慌,技术与事实的纠缠关系激发了无数关于混淆的宣言,声称混淆的计算机可能威胁到真理本身的概念。
AI系统产生幻觉的倾向已成为绩效的基准。Galileo是一家帮助企业客户优化生成式AI应用程序的公司,推出了一个幻觉指数,该指数对来自Hugging Face、Meta Platforms和OpenAI等公司的AI系统的正确性进行排名。Galileo首席执行官Vikram Chatterji表示,金融到医疗保健等各行各业的公司特别渴望对面向消费者的AI产品拥有“极端控制”。他解释说:“他们最担心的问题是:‘如果我发布这个东西,它会胡说八道怎么办?这可能会损害我们的品牌、股票,对世界来说也是非常糟糕的事情。”
由于现代AI的复杂性,专家们不确定这个问题是否能够完全解决。不过,也许并非所有问题都需要解决。“有时幻觉实际上是特性;这就是创造力,有时它是一个bug,”微软首席执行官萨提亚·纳德拉最近在被问及这个问题的后果时说道。“我们都在努力改进如何变得更好。”
在未来一年,越来越多的开发者将致力于利用这些错误和幻想中的魔力。邓恩将其比作一些人类寻求利用化学物质激发艺术冲动的也许有风险的方式。“LSD之旅是一个非常贴切的比喻,”他开玩笑说。“如果模型只做了你要求它做的事情,那它就不是一个真正的创造伙伴。”
Anastasis Germanidis,文本转视频独角兽Runway AI Inc.的首席技术官表示,一定程度的“扎根性”是必要的——对猫的请求片段需要展示猫,而不是狗——但他的团队不想扼杀幻想的产出。对于较短的提示,Germanidis表示,Runway有时会填补空白,“给模型更多自由地想象缺失的属性或用户没有明确提供的属性。”
他还发现创意专业人士正在玩弄这个程序,提供复杂的提示来引发超现实的视觉。导演保罗·特里洛(Paul Trillo)就在Runway中制作了一部备受赞誉的短片,倾向于引擎更迷幻的效果,其中包括地铁下沉和面部特征像粘土动画一样移动的场景。缺陷正是使它如此迷人。在接受《纽约客》采访时,特里洛描述了这部名为《谢谢你不回答》的电影,称之为“部分爱德华·霍普和部分大卫·林奇”,他说AI做出了他不会做出的电影选择,并且“感觉就像在梦中飞翔一样。”
其他开发人员正试图通过微量给AI系统限制。Inworld AI帮助视频游戏开发人员构建互动电脑角色,他们开发了一个“第四面墙”功能,限制角色对人类玩家的反应方式。这些AI角色被注入个性特征、情感、记忆和抱负,这可能导致有趣和独特的行为。但联合创始人兼产品负责人Kylan Gibbs表示,如果它们偏离剧本太远,就会破坏沉浸感。在《星球大战》游戏中的机器人应该能够虚构关于其家乡星球的个人背景,但不应错误地否认达斯·维达是卢克·天行者的父亲。“扩展世界的幻觉和破坏世界的幻觉之间存在一种平衡,”Gibbs说。
尽管如此,他指出一些开发者正在关闭第四面墙功能,特别是在较小的《龙与地下城》类游戏中,那里的宇宙并不受几十年叙事规范的限制。他还看到游戏制作者在制作过程中取消了这个设置,并使用幻觉来构想新的故事情节和支线任务。“你会看到一位作家说,‘我对这个世界有个大致的想法。我只是要在其中创造角色,开始和他们交谈,看看会发生什么,’” Gibbs说。
从这个意义上说,并不是对幻觉的容忍度在改变,而是它的定义在改变。创意型人才更多地在人格化的意义上谈论它,而不是作为一种制造虚假的机器。在处理机器生成的歌曲或营销活动时出现的小问题可能正是用户所期望的。
Visual Electric的邓恩在生成人工智能图形时经常遇到这种情况。随着指令越来越长,计算机最终偏离了他的意图。“你的第一反应是‘这太糟糕了,这不是我想要的,’” 邓恩说。但是,几分钟后盯着它看,他经常意识到:计算机是对的。*阅读下一篇:*谷歌无法捕捉所有的AI图像。你能吗?