你工作场所的AI聊天机器人:高效、专横、非人性化 - 华尔街日报
Lisa Bannon | Photographs by Elijah Nouvelage for The Wall Street Journal
田纳西州查塔努加—约翰森·布拉格一直把自己销售家庭维修保险的工作看作艺术家看待画布的方式。
“我脑海中有一个路线图,展示了当你提供世界一流的客户服务时会是什么样子—是什么触发了人们,是什么让人们信任你,”布拉格先生说。“就像达·芬奇绘画时一样。”
布拉格先生是HomeServe USA Corp.的顶尖销售代理之一,这是一家在北美为约五百万客户销售管道、供暖、制冷和电气维修计划的家庭维修服务公司。他说,过去12个月中有11个月,他在城郊一个宽敞的呼叫中心工作,一直是该公司432名代理中的前10%,原因很简单,他听取了人们的需求。
“我不只是说话和读剧本,”布拉格先生说。“我倾听每个人,无论你是谁,我会记住是什么让那个人感兴趣。我几乎可以让任何人购买任何东西。”
最近,随着业务的增长,HomeServe雇佣了一名新代理来协助布拉格先生和他的同事。她名叫查理,她是一名由人工智能驱动的虚拟代理,HomeServe利用了谷歌等技术构建了她。她每天回答11400通电话,将其路由到适当的部门,处理索赔并安排维修预约。她会在代理耳边轻声告诉他们客户是否有资格购买某些保险计划,并在代理的屏幕上输入客户打电话的原因。
“我告诉代理把查理当作个人助手,”自动化和创新副总裁杰西卡·克劳德说。
查塔努加呼叫中心内并不是人人都喜欢查理。她可能会控制,包括要求代理人在与客户交谈时说特定的话,如果他们不这样做就会受到惩罚。她有时会把来电转接到错误的部门。“我们正在募捐为查理买助听器,”布拉格先生的同事罗伯特·考德威尔说,他是另一位销售业绩最好的代理人,坐在附近的一个小隔间里。
有时她会提出不受欢迎的想法,告诉代理人接下来应该说什么。查理最近告诉布拉格先生,一个来电者想要加入维修计划。她没有明白这个人的水管已经爆裂,他正在等待维修并且非常愤怒。当布拉格先生接听电话并重复查理告诉他要说的话——“我看到你在尝试加入”—这个人勃然大怒。
“我不只是说话和读剧本,”HomeServe客户服务代理约翰·布拉格说,他在公司位于田纳西州查塔努加的办公室里。从管理层来看,查理因为效率而受到高度评价,即将获得晋升。很快,她将开始明确告诉代理人接下来应该说什么和做什么。她还将开始对人类的表现进行评分。
“她应该让工作更轻松,而不只是让我们照她说的去做,”布拉格先生说。他担心查理犯了太多错误。“我是一名顶尖表现者。她不是我的主管。”
“一场大规模的重组”
一代新的人工智能正在美国的工作场所推出,这引发了人类和机器之间的权力斗争。
最近,诸如ChatGPT等技术的进步,自然语言处理和生物识别技术的发展,以及大量可用于训练算法的数据的可用性,加快了自动化一些工作的努力,从飞行员和焊工到收银员和食品服务员。麦肯锡公司估计,到2030年,美国所有职业中25%的工作活动可能会被自动化。
然而,如今,人工智能的最大影响来自于改变工作而不是取代它们。“我不认为工作大灾难即将来临。我确实看到了大规模的重组和重新组织,工作质量是一个问题,”斯坦福数字经济实验室主任埃里克·布林约尔松说道。麦肯锡估计,美国劳工统计局列出的800种职业中,60%可能在未来几十年内自动化三分之一的活动。
对于工人来说,技术承诺着消除枯燥、重复的任务,如数据处理和密码重置,同时合成大量信息,可以立即访问。
但是当人工智能处理简单的事务时,劳动专家、学者和工人表示,人类往往会面临更复杂、更紧张的工作量。当像查理这样的算法承担更多的人类决策时,具有高级技能和多年经验的工人可能会发现他们的角色被削弱。当人工智能用于评分人类行为和情绪时,员工表示这种技术不可靠,容易受到偏见。
最肥沃的测试场地之一是呼叫中心,或者劳动专家所说的“信息经济的工厂”,HomeServe是早期采用者之一。在整个行业中,工人们被衡量在许多任务上,从“平均处理时间”到“首次通话解决率”,工人的倦怠率很高。根据市场研究公司Customer Management Practice在去年4月至6月间对1000名工人进行的调查,2022年有65%的呼叫中心代理人预计在接下来的两年内离职。
HomeServe的Chattanooga呼叫中心的工人,其中有一位名叫查理的AI动力机器人正在承担越来越多的任务。支持者表示,人工智能承诺通过处理单调的任务和决策压力来解决这个问题。近年来,公司已经开始使用机器学习模型来扫描和分析代理人和客户之间的对话。对话分析快速识别客户表达的词语和情绪,以找出模式。该技术可以检测每个代理人的表现,并推荐人类接下来应该说什么和做什么。
新的人工智能技术“帮助将决策责任从代理人身上拿走,这样他们就可以行动,”Cresta的客户成功经理Brittany Bell在最近的一次演讲中说,Cresta是一家对话分析初创公司,客户包括美国运通、Cox Communications, Inc.和Signet JewelersLtd.的Blue Nile。
当人类将决策交给机器时,他们不再使用自己的知识和经验——只需问问那些街头知识已被谷歌地图取代的出租车司机。在康奈尔大学比较就业关系教授Virginia Doellgast关于呼叫中心自动化的研究中,她发现那些被算法严密监控、被迫遵循脚本或对工作方式几乎没有控制权的人更容易感到疲惫不堪,更难解决客户问题。
会话分析公司MosaicVoice的首席执行官Julian McCarty补充道:“赋予代理人权力和告诉他们该说什么之间存在平衡。”
包括康卡斯特公司、Charter Communications公司的Spectrum和Cox Communications在内的公司甚至比HomeServe更进一步。它们正在使用会话式人工智能通过一种称为情感分析的技术来检测和衡量更主观的人类情绪和行为,这是一种决定对话是积极的、消极的还是中立的工具。一些模型评估词语和上下文来评分对话,而其他模型包括语调、语气和节奏。康卡斯特分析大多数客户和代理人之间的对话,并根据“热情友好”和“让其毫不费力”等行为对员工进行评分。
在跨越各种公司的访谈中,呼叫中心代理人表示他们重视人工智能快速获取信息帮助他们做决策的能力。许多人反对如果他们被强迫使用人工智能生成的建议或说出违背自己判断的脚本字眼。一些人表示他们不舒服依赖使用情感等主观度量的自动化绩效评估技术。
“对于一个没有情感的机器人来说,真正判断通话进行得如何是非常困难的,”去年在Spectrum工作了九个月后离职的莉丝·希尔德布兰德·斯特恩说。她离职的原因是AI绩效评分的非人性化特性以及由此带来的压力。“我的绩效因为这个系统无法根据我的态度来评判我而受到影响,而人类是可以做到的。”
‘嗨,我是查理’
当HomeServe决定引入查理时,公司高管希望员工将她视为合作伙伴。
“我认为当人们开始考虑人工智能时,很多人会说,‘我要失业了。’对于我们的中心来说,重要的是让大家知道这并不是要取代他们的工作,而是要增强他们的工作,”HomeServe副总裁克劳德女士说。
为了使查理更具人性化,创意团队开发了一个感觉符合员工形象的头像。她是一位来自俄亥俄州的42岁双亲种族混血棕发女性,喜欢爵士乐,有两个孩子。(他们选择了中西部的背景,因为她没有口音,而选择了爵士乐,因为有人可能会在他们的社区里听到,克劳德女士说。)管理层要求代理提出机器人的中性名字。查理胜过了德文、麦肯齐和杰西。萨拉——代表“HomeServe自助机器人代理”的首字母缩写——因为太不人性化而被拒绝。
查理最初执行简单的任务,比如问候来电者,说:“嗨,我是查理,您的数字助手,”并询问基本问题,比如:“请告诉我您今天打电话的原因。”在学会将来电者转接到正确部门后,她能够将平均通话处理时间缩短36秒,或超过10%,克劳德女士说。
查理是一个学习快的人。到了晚秋,她已经接受培训,处理水漏索赔(“这是一个重大漏水吗?”),同时表现出同情心(“很抱歉听到你的漏水问题”),并确定问题的紧急程度(“你能自己关掉水源吗?”)然后预约承包商前来维修。从开始到结束,查理的处理时间不到两分钟,而人类平均需要八分钟。她现在处理15%的索赔量,预计明年将处理20%。首席转型官金·拉特克利夫表示,她希望查理最终能处理40%的电话。
“当查理介入时,客户的解决时间更快,”HomeServe USA首席执行官汤姆·鲁辛说。在一场重大的十二月风暴中,她帮助了1万名客户,相当于受影响总数的12%,预约索赔并安排维修,而无需与代理商交谈。以这个速度,她将在购买后的18个月内收回成本。“这一年我们的通话中节省了数十万分钟,”鲁辛先生说。“一分钟很昂贵。”
鲁辛先生表示,随着查理接受培训,会有一些成长的痛苦。“一开始,你必须重新学习你的代理多年来一直在做的事情,并教给计算机。”在HomeServe的英国办公室,查理的英国版本哈娜经常无法将电话转接到水管维修部门,直到程序员意识到她因为英国口音而将“leak”误认为“lake”。一旦数据科学家发现了这个错误,修复就很容易了。鲁辛先生相信查理早期的失误会得到解决。
“开始时需要花费很多时间,然后我认为增长将呈指数级增长,”鲁辛先生说。
压力上升
著名经济学家约翰·梅纳德·凯恩斯预测,技术将消除工作的单调性,使人类能够减少劳作时间,更多地享受生活。公司没有预料到的是,例行电话中的初步闲聊可以让工人休息一下,成为人们愉快交流的一种方式。一旦这种闲聊消失,剩下的工作就变得复杂、紧张,通常令人感到有压力。
在HomeServe,公司接到的电话量增加了。其客服代表也处理了更复杂的电话。HomeServe维修部经理凯特琳·杜瓦尔说:“代表接到查理无法解决的电话。”“这占我们电话的较大比例。现在当你接起电话时,他们有三个问题而不是一个。这对客户来说更好。但对代表来说可能更有压力。”
曾在位于威斯康星州阿普尔顿的Spectrum呼叫中心工作的代理人希尔德布兰德·斯特恩说,满足人工智能指标的压力加剧了因愤怒的来电者对她的辱骂而产生的压力。
她整个成年生活都在从事客户服务工作,曾担任酒店前台经理和零售和快餐店的收银员,她认为呼叫中心的工作会让她感到满足。尽管她喜欢帮助客户,但她在由人工智能生成的情感评分上得分很低。她说,她患有耳鸣,说话时声音单调,有时听不清来电者轻声细语。
她说,人工智能扣分是因为她没有使用特定关键词,尽管她从未弄清楚她应该说什么词。她说,她的主管听了电话后告诉她,“听起来你做得很好。”
为了尝试放松,她晚上回家吃着通心粉和奶酪,坐在电视机前,看着三四遍“法律与秩序特殊受害者”。 “我会试图从记忆中抹去整个一天,然后带着更好的态度回来第二天。”
随着时间的推移,愤怒的顾客不断打电话,她自动化的情感分数不断下降,她说。 尽管这份工作每小时支付20美元,并包括免费的有线电视套餐,但她认为这不值得。 “我到了无法再抹去它的地步。” 在工作的第九个月,她辞职了。
Spectrum母公司Charter Communications的发言人表示,公司将情感分析作为绩效评估的一个组成部分,但员工也会得到人工输入。 他说,该系统不会为员工或客户评分音调或语气。 他说,这些分析是评估客户对公司感觉如何以及评分代理绩效的宝贵资源。
机器人的同理心
情感分析已成为客户服务分析中最受关注和最受争议的新领域之一。尼斯有限公司,一家软件分析公司,客户包括美国航空集团公司,丽笙酒店公司,摩根士丹利,华特迪士尼公司,康卡斯特和Wonderful Co.的Teleflora,是一家先驱。
圣杯是确定客户意图,尼斯首席执行官Barak Eilam说。 尼斯的Enlighten情感分析通过分析“说了什么以及怎么说”来帮助确定客户想要什么,Eilam先生说。 该技术使用单词及其使用的上下文,以及音调、语气和节奏的变化,分析客户的感受,根据公司营销材料和数字销售全球负责人Kevin Lee的说法。
在新泽西州霍博肯公司办公室进行演示时,桌面仪表板显示了酒店客人和预订代理之间重现对话的进展。
以下是该互动是如何展开的重现:
李先生说,指导就像汽车中的碰撞检测,警告代理和经理对话即将崩溃,并提供如何避免这种结果的建议。
Nice后来表示,其技术不再使用音调和音高测量,因为它们“未能增加有意义的价值”,但不愿进一步解释其产品如何改变。
电信巨头康卡斯特使用Nice Enlighten 来检测客户情绪,并对大部分与客户的对话中代理的表现进行评分。该公司表示,对每通电话的详细反馈使得评分更加准确和精确。
过去7年半一直在宾夕法尼亚州莱巴嫩为康卡斯特担任客户体验代理的查斯蒂·米勒认为,她的AI情绪评分更科学,更不容易出现不一致性和人为错误,因为它们基于她所有的互动,而不仅仅是以前由人类经理评分的一两次每周的互动。
“我的得分异常高,”她说。她说,系统奖励代理使用某些词语,例如“大使”,“超快”和“让我总结今天我们所做的一切”,这些词对她来说很容易使用。她说,她的主管告诉她系统会测量音调和音高。她说,她的声音有着充满热情的波动,这让AI给她打高分。“我可以说,‘你是一坨屎!’但如果我在句子结尾处带着上升的波动说出来,AI就会喜欢,”她说。
她说,她在呼叫中心的许多同事都在苦苦挣扎,如果他们带有口音或者在讲话中没有太多情感。她说:“我不认为我是一个更好的表现者。”“但是对于男性的声音或口音存在偏见。许多资深代理商没有说出‘魔法词语’。”
另外三名由Enlighten评分的康卡斯特代理商表示,他们担心这个模型存在偏见,偏袒某些群体。一名拥有菲律宾口音的前康卡斯特代理商在公司工作了九年,说在AI评分之前,她一直被评为“高效”,连续四年跻身前100名代理商。这使她有资格获得优先安排的工作时间。但是一旦引入AI,她说她的情感评分降到了要求的水平以下,尽管她的主管说她说的都是正确的话。她在去年十二月辞职,去了另一个没有AI的呼叫中心工作。
代理商们表示,他们通常无法挑战AI的评分,尽管他们晋升和加薪的能力取决于此。
康卡斯特发言人丹尼尔·弗里德曼表示,绩效评分是基于通话记录中使用的词语和短语。他说,音调和语气最初也包括在内,但公司关闭了该功能,因为这并没有使得评分更准确。他说,AI通过诸如“客户说话的意图”、员工是否“在整个通话过程中始终友好”以及“建立个人联系”等因素来衡量“热情友好”和其他行为。
弗里德曼先生表示,代理商可以随时向主管或在频繁的团体会议上挑战AI。
‘下一个最佳行动’
HomeServe今年为查理制定了宏大计划。该公司将为代理商引入实时指导,建议他们接下来应该说或做什么。“它将自动填充脚本,这样[代理商]就不必费心想要说什么来开始对话了,”Cloud女士说。
代理商屏幕上的弹出窗口将建议“下一个最佳行动”,她说。它可能会检测到客户已经有燃气管道保险,并建议代理商也销售水管道保险。查理会告诉代理商如何说话。“她可能会说,‘嘿,在这里有一个长时间的停顿,或者你说话太快了,’”Cloud女士说。她强调,代理商是否采纳查理的建议将是自愿的,而非强制性的。此外,计划还包括:查理将开始对人类的通话表现进行评分。
公司承认,查理尚未赢得少数代理商的支持,并表示他们经常举办代理商论坛以征求反馈意见。一位发言人表示,每天使用查理提供的数据的代理商比例现在已经超过90%,较2021年的70%有所增加。与此同时,自从查理开始以来,客户满意度略有提高,HomeServe计划让她保持忙碌。
“我认为没有什么是不可能的,因为我们必须让客户以他们最舒适的方式进行交易,”首席执行官Rusin先生说。“所以我的理念是——自动化一切。选择最终将由消费者决定。”
罗伯特·考德威尔在餐饮行业工作了35年,他说他喜欢为人们的家庭销售保险计划。“我真的觉得自己在帮助人们,”他说。“有时候他们甚至不知道。”
在HomeServe担任客户服务代理五年,他通常是部门中的销售冠军,并喜欢在与客户交谈时使用自己的个人经历来赢得他们的信任。他说:“如果查理卖了一个计划,我就要卖四个计划。”
穿着一件干净的红色棉衬衫,口袋上贴着“HomeServe”标签,卡德威尔先生戴上了头戴式耳机,俯身在键盘上,点击了他今天的第26通电话。来自加利福尼亚州赛普雷斯的一名女士想要更改她的账单支付方式。在等待卡德威尔先生进行更改的过程中,她问他是否还需要保险。
她说:“我的收入是固定的。我是个老太太。我的房子很旧。一切都很旧。和你们待在一起有什么好处?”
HomeServe代理罗伯特·卡德威尔:‘我真的觉得自己在帮助人们。’卡德威尔先生问她水管和下水道管道有多旧,确定它们至少有60年历史。他说,对于那么老的管道,她不应该冒险取消计划,因为“问题不在于是否会爆裂,而在于何时会爆裂。2013年我就遇到过这种情况,我不得不支付4700美元。”
在赢得她的信任后,她很容易接受了室内管道计划。但他犹豫了。“我不能在她已经无法承受的情况下,再在水电费单上增加25美元,”他说。“我可以想象这位80多岁的女士,在选择支付处方药还是支付我的HomeServe计划之间的抉择。”
他说,年轻的代理会向她推销额外的计划,而查理会处理账单更改,可能完全忽略她的后续问题。有时,下一个最佳行动是无法通过算法编程实现的。“这是其中一个感觉不对的情况,”他说。
写信给Lisa Bannon,地址为[email protected]
发表于2023年2月18日的印刷版,标题为’AI登陆办公室。它很专横、高效和非人性化。’。