Adobe针对OpenAI和Midjourney推出了具有律师证明的AI艺术机器人-Bloomberg
Austin Carr, Brody Ford
亚当的创造由米开朗基罗重新想象,使用了二十多个Firefly AI提示在Photoshop中。
插图:731;来源:Alamy;Adobe生成AI
去年秋天,Adobe公司向其庞大的经验丰富的专业摄影师网络提供了拍摄1000张香蕉照片的机会。每张照片售价60美元。另一个委托要求拍摄“真实情境中”的国旗照片,另一个售价80美元的委托要求拍摄数百张咀嚼食物的特写照片。一项宠物肖像的任务要求至少拍摄500张不同品种的狗和猫的JPEG照片,并明确指出不能出现“穿着任何衣物”的照片。
这些非常具有针对性的“任务”,正如Adobe在工作简报中慷慨地称呼它们的那样,不是为了满足对水果/馅饼/宠物照片的突然需求,而是为了提供原始材料,以供其于去年三月发布的新旗舰人工智能产品 Firefly使用。当时,AI艺术生成器 Midjourney和 Dall-E已经像 未来的玩具一样在艺术家和视觉上的无能者中迅速传播。突然之间,任何人都可以将一系列词语转化为令人不安的逼真图像,无论是一张备受瞩目的 深度伪造的唐纳德·特朗普被逮捕的图像,还是一张 病毒式拼贴,“一瓶沙拉酱在法庭上作证”——不知何故,这确实看起来像是在接受盘问的沙拉酱。
与Midjourney Inc.和其他生成式人工智能初创公司不加区别地吞噬互联网上的数据来推动他们的机器想象力不同,知识产权灾难,Adobe主要是在Firefly上进行训练,使用的是其拥有3亿张库存照片和其他视觉素材的Adobe Stock数据库,这些素材通常被许可给营销人员和媒体公司用于广告和文章。但Firefly需要更多的日常物品照片,以便它能够处理其引擎仍然难以应对的场景,并使其输出不再像商业广告一样过于光滑。Adobe设想Firefly成为设计师和企业用来制作品牌营销活动、产品包装概念等的新工具,并表示其局限性将证明是一个优势。与竞争对手不同,该应用程序拒绝包括公众人物(例如特朗普)、某些词语(“被捕”)甚至品牌(“Hidden Valley牧场”)在内的提示。它不会呈现商业调味品的图像,而是提供田园风光。
但在创意人士眼中,本应是数十年来最疯狂的数字革命却显得乏味,而Adobe高管却看到了它最性感的特性:责任保护。“许多大型企业的法律部门每次他们的设计部门想使用Firefly或任何模型时都会介入。他们会说,‘不,不,不,’”Adobe人工智能产品副总裁Alexandru Costin说。当Costin向客户澄清Adobe的“商业安全”方法提供知识产权保护,包括在有人试图起诉时提供法律支持时,气氛就会改变。“他们会说,‘哇,这真的很不同。’”
“他就像,‘哦,我的上帝,Dall-E。’那时他会对我说,‘我们要为Adobe构建这个’”
可预测性听起来可能是一个乏味的目标,但是Photoshop和PDF的先驱主要通过成为想象力和企业之间的实用桥梁来建立其软件帝国。在大部分时间里,Adobe通过将创意专业人士吸引到其编辑软件生态系统中来击败了竞争对手。尽管存在更便宜和不那么复杂的替代品,但是图形设计师、广告商、出版商、摄影师和摄像师从未能够摆脱对Adobe的依赖。在雇佣或委托他们的公司中,Adobe一直是默认选择,而且需要很长时间才能掌握。放弃Adobe所称的“内容供应链”去学习不那么普遍的软件通常不值得麻烦。因此,创意人士不情愿地每年为完整的Creative Cloud套件支付720美元,这类订阅占据了大部分 Adobe 194亿美元的年收入。现在,随着艺术家们对Midjourney和Dall-E作为梦幻工厂和超现实制造商的赞美,Adobe正在将人工智能作为软件附加组件进行销售。用Firefly产生灵感,用Photoshop完善它们。“这种魔法真正体现在界面上,”Adobe首席执行官Shantanu Narayen说。
一些Adobe员工担心公司对创意专业人士的控制使其朝着人工智能的方向进展缓慢,将其视为不是一种存在威胁,而只是另一个足够好的功能,以保持客户付费。年轻艺术家正在转向更简单的设计应用程序,比如 Figma,Adobe最近试图以200亿美元的价格收购该公司,以刷新其声誉,但交易最终 在监管压力下破裂。Midjourney没有应用程序,甚至没有太多界面:该服务通过社交网络 Discord运行,用户在聊天窗口中输入提示,然后AI图形会被生成。对于Firefly,Adobe需要说服其数百万忠实客户使用其新产品,而不必担心最终会取代他们。在10月份的Adobe活动上,该公司的付费大使Jaime Derringer向创意人群重申了Adobe永远不会完全自动化他们所做的事情。“如果人工智能取代了我们所有人,Adobe将不再举办会议,”她说。“将没有人使用他们的软件来支付账单。”
维纳斯的诞生由桑德罗·波提切利重新想象,使用了两打以上的Firefly AI提示在Photoshop中。插图:731;来源:阿拉米;Adobe生成AIAdobe认为自己并不是人工智能的后来者。2016年,在其年度开发者大会上,一位Adobe研究员在台上展示了一个深度学习原型,它可以识别照片中的天空,并通过简单点击,用云朵或阳光替换天空,同时自动将新的光线与前景物体进行混合。回顾起来看起来很有趣,但当时,观众们欢呼雀跃。
该公司有着悠久的突破历史。Adobe成立于1982年,由来自施乐著名的帕洛阿尔托研究中心的西装领带科学家创立,首先发明了一种名为PostScript的编程语言,使计算机能够与打印机进行通信。在1990年代初,它推出了便于取代纸张的便携式文档格式。Adobe收取至少195美元的费用用于编辑文件的工具,后来企业和政府机构对打印成本的节省感到心醉神迷。“国税局很喜欢它,”Adobe的联合创始人约翰·沃诺克曾说。(沃诺克 于2023年去世,公司表示他与现任CEO纳拉延的最后一次对话是关于Firefly的。)
最初,Adobe担心在那个时候推出的另一款产品Photoshop几乎每月只能卖出500份。摄影师道格·梅纽兹回忆说:“我认识的平面设计师非常反对它”,他记得Adobe邀请画家大卫·霍克尼来公司教他使用软件,并将他转变成数字艺术的先驱影响者。Photoshop通过在每个版本中充斥着用于消除编辑繁琐的功能,比如轻松克隆像素和操纵图像的不同图层的按钮,赢得了客户的青睐。
该公司还积极进行收购。它在上世纪90年代收购了 Aldus Corp.,淘汰了一家Photoshop竞争对手,并为Adobe提供了InDesign的基础,现在已成为主导的海报和杂志布局系统。2005年,该公司以34亿美元收购了 Macromedia,淘汰了另一家竞争对手,这次是Adobe Illustrator,其绘图应用,并使公司在Web发布领域拥有了坚实的地位,包括Dreamweaver和Flash在内的产品。在这个时候,Adobe甚至威胁要起诉 Microsoft Corp.,因为后者计划在Office中添加“另存为PDF”选项。Adobe要求支付费用后,Microsoft取消了该功能;两家公司后来和解。
Adobe提供的应用程序越是互补,它就越能将它们打包在一起,并向出版商和设计机构收取高价。一些捆绑销售的软件售价约为2000美元,成为学生和自由职业者常见的盗版目标。纳拉延从Adobe的工程经理晋升为首席执行官,并于2007年将公司从软件销售转变为2012年的定期订阅,引发了已经感到被敲诈的创意人士的强烈反对。当时CNET和分析公司Jefferies Financial Group Inc.的一项非科学调查发现,1642名受访用户中有93%表示会寻找Adobe产品的替代方案。但很少有人真正采取行动:到2013年底,Adobe的订阅用户超过了140万,其股价创下历史新高。
纳拉延在去年十月的洛杉矶Adobe开发者大会上。摄影师:乔丹·斯特劳斯/AP尽管苹果公司和谷歌应用商店中有大量免费或低成本替代品,订阅仍在持续增长。到那时,Photoshop已经成为一个贬义动词,意味着伪造或夸大的视觉效果,甚至霍克尼也称其制作的成品“乏味”。Canva公司因其基于网络的工具而蓬勃发展,使用户摆脱了Adobe产品的臃肿;Snapchat和Instagram开始发布令人印象深刻的图像滤镜。Adobe试图匹敌这些新服务的易用性,但失败了。“我们只是非常不成功,”Adobe的总法律顾问达纳·拉奥谈到了与Figma竞争的产品XD。然而,Adobe的付费用户群不断增长,在2010年代末超过了1000万。
当Adobe在2016年的开发者大会上宣扬人工智能时,并不是在吹嘘其业务的下一个前沿,而是在试图抵制多年来对其软件变得过于复杂和昂贵的批评。纳拉延当时是在推销机器学习作为一种效率工具,可以在“几秒钟而不是几分钟”内完成曾经需要手动完成的任务。从那时起,Photoshop不断推出新的人工智能功能,比如“面部感知液化”,让用户可以快速放大眼睛和微笑。2020年增加的“神经滤镜”让用户可以拖动滑块调整面部的年龄和从快乐到愤怒的表情。尽管这些图像看起来并不比警方草图更复杂,但Adobe数字影像副总裁玛丽亚·雅普当时吹嘘说“Photoshop是世界上最先进的人工智能应用程序”。
2022年7月,OpenAI宣布向等待名单上的一百万人开放Dall-E,承诺向他们提供完整的商业使用权,用于任何文本到图像的创作。据一位前员工透露,这一发布在Adobe的高层管理人员中引发了“恐慌的冲击波”,他和其他十几位曾参与Firefly项目的工程师、高管、设计师、摄影师和大使在接受《彭博商业周刊》采访时要求匿名,以坦率地讨论该技术的发展。员工之间的邮件往来讨论着社交媒体上疯传的疯狂AI创作。Rao回忆起数字媒体首席技术官Ely Greenfield向他发来惊叹的消息。“他就像,‘天啊,Dall-E’,”Rao说。“那时他会对我说,‘我们要为Adobe构建这个。’”
这是一记必要的耳光。数名现任和前任员工表示,除了诸如天空替换之类的渐进式Photoshop功能外,让Adobe的研究实验室中有前途的AI项目进入产品中似乎是不可能的。据一位前员工称,2019年的一次演示会上警告称生成工具可能引起Creative Cloud的混乱,如今的Adobe首席战略官Scott Belsky似乎毫不在意,他询问这项技术是否可以以某种方式用于改进新用户的Photoshop教程。(Belsky表示AI长期以来一直是公司的重点,但他的工作也包括确保新技术在商业上真正准备好之前不会发布。“成为市场上最好的比第一个更重要,”他回忆起提醒他的团队。)
其他人担心自 cannibalization。如果 Adobe 过分推动 AI 功能,人们可能会认为该公司正在利用技术来取代推动其业务的创意人员。Adobe 设计总监 Samantha Warren 表示,在开发过程中,艺术家们被采访了他们的恐惧和希望。其他研究人员提出了诸如使用生成式 AI 是否感觉像作弊之类的问题。
一小队研究人员尝试了基本的文本到图像工具,但基于较早一代的机器学习的结果并不稳定。一位前员工将 Adobe 在 2021 年左右的 AI 描述为更多的“文本到混乱像素”。那一年,Dall-E 因其首次公开预览而受到赞扬,它可以根据提示生成看起来像儿童涂鸦的作品,比如“一个穿着芭蕾裙遛狗的小萝卜图画”。但是,与 OpenAI 及其合作伙伴微软不断投入数亿美元用于芯片和云基础设施以完善其训练模型,以便能够生成更美观的萝卜、芭蕾裙或狗不同,Adobe 的高层人员抵制分配如此昂贵的计算能力,据现任和前任员工称。
“我不确定创意领域的任何人是否将 Adobe 的所作所为视为真正的前沿。他们只是将 Firefly 良好地打包到我们已经拥有的工具中”
直到 Dall-E 和 Midjourney 风靡之后,Adobe 才认真开始构建后来成为 Firefly 的东西。即便如此,该公司在公开场合仍然专注于其于 2022 年 9 月宣布的 200 亿美元收购 Figma。直到那一年年底,该公司才放松了对昂贵计算能力使用的限制,因为人们意识到它需要承担巨大的成本来在 AI 领域赶上,据从事该项目的人员称。数百名员工被从其他团队调来参与 Firefly 的工作,其中一些人感到他们正在为战争做准备。“这是目前最重要的优先事项,”负责公司数字媒体业务并主导拟议的 Figma 交易的 David Wadhwani 回忆道。
尽管如此,拥有大量企业客户的Adobe不得不遵守与其竞争对手不同的版权规则。因此,它转而利用其库存照片数据库。但是,与人工智能初创公司表面上毫无顾忌地从互联网上抓取的数十亿张图片相比,从专为营销而制作的图像中获取的数据集严重有限,产生了一种令人毛骨悚然的美感。据参与该项目的现任和前任员工称,他们甚至还从在线免费许可数据库中补充了Firefly的照片和视频截图,以使其人工智能引擎具有一定的现实感。
由于人工智能往往会放大社会上最具有毒性的冲动,复制种族主义、暴力或仅仅是不适合广告的概念,Adobe还必须确保其图像对商业客户足够安全。它试图通过阻止诸如“枪支”、“罪犯”、“可卡因”和“呕吐”等词语来避免放射性视觉效果。在Firefly中,你可以有“香烟”,但不能与“孩子”并列,因为有些词语只有在一起使用时才会被标记。(“少年喝一瓶伏特加”会返回高中生拿着水瓶的照片。)随着员工们对内部测试版进行棘手图像的压力测试,这个黑名单迅速增长。Adobe希望避免微软后来陷入的那种争议,当时其人工智能工具因被用于生成包括泰勒·斯威夫特在内的名人的假裸照而受到指责。生成假裸照。
人口统计表现是另一个挑战。据一位前Firefly工程师称,为了确保“医生”、“教师”和“家庭”等普通名词避免种族和性别刻板印象,Adobe修改了搜索提示的语言。例如,在Firefly中,“医生”这个词可以被悄悄地调整以添加诸如“黑人”或“女性”之类的身份修饰词,该工程师补充道,人口统计混合设置为反映用户所在国家的情况。最终,本地化也将启动,这样,在日本输入“早餐”的用户可能会看到米饭和味噌汤,而不是火腿和鸡蛋。
简而言之,使用Firefly可能感觉就像在肩膀上设计一名律师。它于2023年3月首次亮相时,被视为笨重的公司模仿者。它的所有作品都包含一个俗气的水印在角落,它唯一的特点似乎是品牌安全。英伟达公司高级研究科学家吉姆·范(Jim Fan)在推特上发布了Firefly和Midjourney的提示对比截图,其中包括一辆法拉利和皮卡丘的图片。Midjourney表现出色,但Firefly创建的照片是一辆普通的跑车和一个黄色的怪兽,而不是宝可梦。
直到那年春天,当Adobe将Firefly与Photoshop测试版集成在一起,使用户能够在程序内部使用人工智能生成图像并自动增强照片,而不是使用单独的应用程序时,人们终于开始关注。最令人兴奋的功能是自动化繁琐的手动过程,扩展照片然后必须复制其背景以填充新空间;Firefly可以将一个人站在摩天大楼中间的垂直图像变成水平的,然后立即生成一个完美照明的城市,背后有匹配的建筑。用户分享了由Firefly驱动的著名唱片专辑的重新创作——披头士的Abbey Road变成了一个星际街景,Nirvana的专辑Nevermind封面上的游泳婴儿被放入了有鲨鱼的海洋中——创造了该技术的首个病毒式时刻。Firefly并没有制作受版权保护的材料,只是修改它们,因此Adobe并不在意。到7月,Firefly已被用于生成超过10亿张图像。
阿诺尔菲尼夫妇肖像,由揚·范·艾克绘制,使用Photoshop的生成扩展Firefly功能进行了扩展。插图:731;来源:阿拉米;Adobe生成AIAdobe的规模几乎确保了快速采用。iPad素描应用Paper的联合创始人安迪·艾伦表示,艺术家们之所以一直回到Adobe,是因为他们对其产品非常习惯,而在Midjourney和Dall-E中编辑图像仍然“非常繁琐”。要调整图像的光照或修改其他生成器中的内容,用户通常必须不断修改文本提示本身。“我不确定创意领域的任何人是否认为Adobe所做的是真正的前沿技术,”艾伦说。“他们只是将Firefly很好地打包到我们已经拥有的工具中。”
Adobe首席营收官斯蒂芬·弗里德表示,Adobe正在与酒店业、媒体和零售等数十家公司进行实验,指出品牌现在可以立即、合法地更改照片的背景,而无需进行昂贵的重拍。Mattel Inc.的首席设计官克里斯·唐表示,他的设计师们使用Dall-E或Vizcom等AI工具进行头脑风暴,但对于成品,他们只会使用Firefly。即便如此,唐表示,他们仍然谨慎使用这项技术,仅用于替换一些小的通用元素,比如可能出现在芭比娃娃房屋或Hot Wheels套装盒上的邮箱或石头。
也许Adobe面临的最大风险是法院和立法者决定版权问题不适用于AI训练。Adobe律师拉奥承认,这是一个强有力的可能性,因为美国法院对“合理使用”概念的解释非常宽松。在这种情况下,品牌可能会放弃Firefly,转向更好的AI,尽管拉奥对此表示有信心,他们最终还是会回到Adobe来完善他们的作品。
去年夏天,Davide Angelini在意大利亚得里亚海岸的里米尼附近的湖边拍摄了一对慢跑的夫妇。他在Adobe Stock的销售中一直名列前茅,并以自己组织大型生活方式摄影拍摄的能力为傲,这些照片在网上销售得很好,通常每年能赚取约7万欧元(76132美元)的许可费。
但随着计算机生成的图片的流行,Angelini对自己的职业前景持有更加悲观的看法。去年,随着Adobe Stock涌入大量由人工智能生成的图像,他的收入有所下降。该平台是第一个允许出售由人工智能生成的图片的主要平台,不仅是Firefly,还有Adobe的所有竞争对手,这一举措使他们处于尴尬的境地,考虑到其保守的法律立场。图像和创作者的涌入可能进一步贬值现有艺术家的作品,Angelini说。“这就像摄影诞生时夺走了画家的工作一样。”
华尔街预计Adobe将成为第一批真正从人工智能中获利的大型科技公司之一。在最近的一份分析师报告中,研究公司 William Blair & Co.预测,到2028年,Adobe将通过提供更多人工智能功能的订阅和销售Firefly作为独立产品,额外赚取54亿美元的年度循环收入。分析师们认为,这应该能够弥补Adobe因人工智能的出现而每年损失的10亿美元,比如创意人员被解雇,不再需要为其软件付费。(Adobe还在努力销售类似ChatGPT的对话产品,每年打开的PDF文档达到4000亿份。)要实现这一目标,Adobe需要继续依靠其股票贡献者的作品,其中许多人惊讶地发现他们正在帮助训练一个已经开始取代他们的模型。
Adobe表示其库存供稿者条款就在明面上:上传照片后,公司就有权使用这些资产开发新功能(尽管从未明确提到人工智能)。今年9月,公司发放了追溯性奖金给那些经常没有意识到自己已经同意帮助开发Firefly的供稿者。Adobe拒绝透露将提供年度奖金的时间长度以及如何计算奖金的细节,其中一些奖金低至70美元。“我们不会说,‘这是我们使用的公式,输入你的数字,这就是你的报酬,’”负责Adobe创意云业务的Ashley Still表示。一家代表数百名摄影师的库存代理公司的联合创始人在去年底收到了一笔不到2500美元的付款,但没有收到有关其艺术家的照片被用于Firefly培训的详细信息。这个人担心自动化对人类创造力意味着什么。“数据科学家对摄影或艺术一窍不通,”这位联合创始人表示,由于担心影响与Adobe这个重要客户的关系,要求匿名。
工作焦虑成为Adobe十月开发者大会的核心主题,成群的设计师、电影制作人和意见领袖聚集在洛杉矶会议中心,聆听Adobe最新人工智能功能的介绍。在一个演示中,公司展示了其视频编辑器如何可以实时移除一位穿西装的绅士的领带,这让已经对人工智能可能淘汰后期制作职位感到焦虑的好莱坞人士感到震惊。“将会有颠覆,”Narayen承认。“但在宏观范围内,那些有激情、有兴趣和有动力的人,他们会发现人工智能会增强他们谋生的方式。”
在意大利的湖边,意外的雨水正在破坏安格利尼的拍摄,而那些慢跑者——付费模特——开始感到寒冷。他花了一些时间来放松自己,并浏览了一些库存图片网站,包括Adobe,以寻找灵感。“所有畅销书都是由人工智能制作的。一年前还都是真实照片,”安格利尼回忆道。他发现自己在想,“为什么我要在这里花钱和时间,而不是在家里免费用Midjourney拍照呢?”*阅读下一篇:*人工智能能揭示古代世界的秘密吗?