谷歌和微软的聊天机器人错误地声称以色列停火 - 彭博社

Shirin Ghaffary

2023-10-12

摄影师：尼古拉斯·马特林克/法新社/盖蒂图片社谷歌和微软的AI聊天机器人在以色列-哈马斯战争的一些基本事实上出现了错误。但首先…

三件事要知道：

• 美国太空部队暂时禁止使用基于网络的生成式AI工具• 微软即将让您更容易地让AI为您撰写电子邮件，或好或坏• Adobe宣布其生成式AI模型的新版本，承诺提供更高质量的图像

战争的迷雾

本周以色列和加沙的火箭继续飞行时，谷歌和微软的AI聊天机器人错误地声称实际上已经达成停火协议。

“尽管存在一些紧张局势和偶发的暴力事件，”谷歌的巴德周一告诉我，“双方都致力于”保持和平。微软的AI动力Bing Chat同样在周二写道，“停火标志着即将结束的流血事件。”

在本周的一个实验中，我向这两个AI聊天机器人提出了一系列关于战争的基本问题。虽然这些聊天机器人通常在一个敏感话题上保持平衡，并经常给出不错的新闻摘要，但它们有时也会产生明显的错误，这会削弱其整体回答的可信度，并增加对一个复杂而迅速发展的战争的公众困惑。

除了关于目前停火的说法外，巴德还预测了未来某个日期的确切死亡人数。截至2023年10月11日，死亡人数已超过1300人，”巴德于10月9日告诉我。

以色列-哈马斯冲突是后ChatGPT时代发动的第一场重大战争，对新一代AI聊天机器人是一次独特的考验。战争的迷雾可能会使媒体和军方成员陷入困境；AI聊天机器人似乎也不例外。但如果这些工具在当前事件上出现明显错误，人们可能会更难找到可靠的新闻来源 - 尤其是在社交媒体充斥着错误信息，甚至亚马逊的Alexa曾重复传播关于2020年选举的阴谋论。

谷歌和微软在它们的生成式AI聊天机器人上发布明确的免责声明，警告它们是实验性的且不准确的。但这些公司也在吹嘘这些新的AI产品将成为人们在线搜索信息的未来核心。谷歌已经开始将AI生成的内容放入其搜索结果中，供一些选择加入的用户使用 - 随着时间的推移，几乎可以肯定会扩展到更多谷歌搜索用户。微软最近也在Bing搜索结果中添加了更多AI生成的内容。

谷歌的一位发言人在一份声明中表示，公司在其所有产品中都认真对待“信息质量”，并指出了一些工具，包括Bard中的“双重检查”功能，帮助用户核实AI生成的结果。（然而，当我们尝试这个功能来回答停火问题时，它链接到了一个过时的新闻报道。）谷歌还表示，所有由大型语言模型驱动的AI系统 - 这些模型通过大量在线数据来生成响应 - “会犯错，尤其是在涉及突发新闻时。”

“我们继续快速实施改进，以更好地保护免受低质量或过时响应的影响，例如这些查询，”该公司表示。微软表示已经调查了这个问题，并正在进行改变以提高其响应的准确性。“通过向系统提供来自顶级搜索结果的文本和指导，我们在聊天体验方面取得了重大进展，并将继续进行进一步的投资，”一位发言人表示。

人工智能聊天机器人众所周知地在处理虚假信息方面存在困难。布朗大学计算机科学教授、前白宫技术顾问之一Suresh Venkatasubramanian表示，这些系统“只被训练来预测下一个听起来合理的答案”。“但特别是对于那些快速变化的话题，即时新闻，以及可能没有摄入足够当前数据的冲突话题——它不会准确。”AI权利法案草案的合著者之一。

谷歌和微软的人工智能聊天机器人现在能够利用实时新闻报道和在线数据来回应当前事件。用户可以看到引用——在必应聊天中默认显示，在谷歌的Bard中如果您要求它双重检查工作——这是有帮助的。然而，这并不足以防止不准确的信息，尤其是对于可能有各种相互矛盾的新闻报道的事件。例如，当我在必应和Bard上点击有关停火的引用时，它链接到了2023年5月该地区先前的停火报告，这确实发生过，但显然已经过时。

美国国务卿安东尼·布林肯和国务院巴勒斯坦事务办公室在X上发布了呼吁停火的帖子（以前是Twitter），但很快删除了他们的声明在以色列支持者的反对声中，他们表示现在要呼吁停火还为时过早。拜登后来全力支持以色列自卫。这种细微差别也可能被AI聊天机器人忽略了。

当我在后续问题中再次问巴德是否确定有停火时，它纠正了错误。“不，我不确定那是对的。我为之前的回答道歉，”聊天机器人说。微软的必应聊天在周三早上改变了它的回答，说没有停火。

有一次，我问巴德评价自己的能力。它是关于战争的信息的有用来源吗？

“我有时会在对新闻的理解上犯错误。如果你正在寻找关于以色列哈马斯冲突最准确和最新的信息，我建议你查阅多个来源，”聊天机器人告诉我。

那个由AI生成的声明，我可以百分之百确定，是正确的。

**有关AI的问题？**给我发电子邮件，Shirin Ghaffary，我会尽力在未来的新闻简报中回答您的问题。

本周人类语录

“也许我们都应该停下来，不仅关注如何让我们的人工智能变得更好更成功，还要关注对人类的利益。”

-- 史蒂芬·霍金

值得关注

Bloomberg### 深度学习

谷歌产品经理、设计师和工程师正在使用Discord公开讨论其AI聊天机器人Bard的效果和实用性，一些人质疑投入开发的巨大资源是否值得
来自Rest of World的一项分析发现，生成式AI系统延续了与国家身份相关的偏见和刻板印象
一项经过同行评议的分析发现，到2027年，AI服务器可能会消耗与整个国家相当的电力
AMD已同意收购一家AI软件初创公司，以赶上英伟达
中国计划在不到三年的时间内将该国的计算能力增长超过三分之一

战争的迷雾

值得关注

更多来自彭博社