没有玩家的视频游戏 - 彭博社
Jeremy Kahn
人工智能在国际商业机器公司(IBM)的深蓝击败世界冠军加里·卡斯帕罗夫的六局棋赛以来的20年里取得了长足的进步,甚至在沃森战胜肯·詹宁斯的六年里也如此。*危险边缘!*计算机已经在跳棋、双陆棋、扑克和围棋等游戏中击败了顶级人类玩家。再加上 超级粉碎兄弟:大乱斗,这是一款2001年任天堂公司推出的格斗游戏,让你可以让,比如说,马里奥对战皮卡丘。
快速了解人工智能
人类要感谢麻省理工学院的研究人员对此次失败,在一篇论文中进行了详细记录,他们在二月份发表,但 大乱斗 并不是唯一一款受到学习机器大量游玩的电子游戏。人工智能软件已经攻克了 超级马里奥兄弟;早期的雅达利公司游戏如 太空入侵者;街机经典 吃豆人 和 真人快打;甚至是移动游戏热门 愤怒的小鸟。乐观主义者认为,人工智能可以帮助解决世界上最棘手的问题,包括癌症和气候变化。那么,为什么人工智能系统花这么多时间在游戏上呢?
这全都与数据有关。游戏允许人工智能软件在精心控制的环境中处理现实世界中存在的复杂逻辑问题——不确定性、谈判、虚张声势、合作,弗拉德·菲罗尤说,他是破解 大乱斗 的团队成员之一。研究人员可以从相对简单的视频游戏问题开始他们的新兴人工智能,进行数千次或数百万次测试,然后随着系统学习处理初始问题,逐渐转向更复杂的挑战。
超级粉碎兄弟: melee
来源:YouTube“通过游戏,你可以生成任意多的数据,”DeepMind Technologies Ltd.的首席执行官Demis Hassabis说,这是一家由谷歌母公司Alphabet Inc.拥有的伦敦人工智能公司。“你想要找到最佳平衡点,既不能太难,也不能太容易,适合你当前的算法。”在过去三年中,DeepMind训练软件掌握Atari游戏,并击败世界顶级围棋选手,这是一种在亚洲流行的战略棋盘游戏。
游戏环境非常适合所谓的强化学习,非营利实验室OpenAI的研究员John Schulman说,该实验室得到了特斯拉公司埃隆·马斯克、Y Combinator联合创始人山姆·阿尔特曼和风险投资家彼得·蒂尔等人的支持。强化学习意味着机器通过试错过程找出适当的行动序列。同样,受控环境也有助于:教一个算法如何在赛车游戏中驾驶比在你的车上安全得多。Uber Technologies Inc.旗下的无人驾驶卡车公司Otto的一名工程师尝试教AI软件玩侠盗猎车手V,英特尔公司的一个团队也进行了类似尝试。
“我们非常感兴趣的是,当你在同一环境中有多个智能代理时会发生什么。他们如何互动?他们能学会合作吗?” —帮助创建马尔默项目的微软研究员Katja Hofmann
哈萨比斯表示,DeepMind专注于游戏,因为它相信真正的通用人工智能必须理解其在物理环境中的存在。他说,游戏中的模拟环境是一种在不必构建机器人(这可能非常麻烦)的情况下实现这一点的方法:“它们很慢。它们会坏。你无法比实时更快地运行。你无法并行运行数百万个。”
一些有影响力的高管对游戏研究嗤之以鼻。“我们并不是为了在游戏中击败人类而追求人工智能,”微软公司首席执行官萨提亚·纳德拉在他公司九月份的开发者大会上说。相反,他表示,微软将其未来的很大一部分押注于人工智能,以帮助解决“我们社会和经济中最紧迫的问题。”负责微软在英国剑桥的人工智能研究实验室的克里斯·比肖普表示,将竞争性游戏作为人工智能的基准也加深了人们对智能计算机威胁人类的恐惧。
尽管如此,微软创建了基于视频游戏Minecraft的人工智能研究环境项目Malmo,而它恰好拥有该游戏。比肖普表示,Minecraft并没有强化人机对抗的叙事,因为它没有设定目标,也不一定是竞争性的。
对游戏模型的批评并没有阻止其他人工智能研究人员。除了侠盗猎车手V,他们还使用数十款游戏作为测试,包括星际争霸II、蒙特祖玛的复仇和Freeciv,这是一款基于西德·梅尔的文明系列的免费游戏。但正如OpenAI的舒尔曼所说,真正的诀窍是开发能够解决不仅仅是一个游戏,而是你给它的任何游戏的人工智能。然后,这项技术可能为生活的游戏做好准备,而不是米尔顿·布拉德利版本的游戏。
游戏理论
研究人员正在训练计算机击败数十款视频游戏。不同的游戏有助于磨练不同的技能。
超级粉碎兄弟:近战谁 麻省理工学院的研究人员技能 与多个玩家竞争和处理不完美信息的策略
自由文明谁 Arago,一家德国人工智能公司技能 记忆、长期规划,以及在回合制游戏中补偿不完美信息
马尔默计划(我的世界)**谁 微软技能** 从具身的第一人称视角在3D空间中移动,以及与人类玩家和其他人工智能代理进行规划和合作
实验室谁 DeepMind技能 从第一人称视角在迷宫般的3D世界中导航,记住路线,考虑多个盟友或对手
侠盗猎车手V谁 Craig Quiter,Otto(Uber拥有的自动驾驶技术公司)的软件工程师;英特尔;达姆施塔特大学技能 驾驶——是的,驾驶,而不是谋杀人
星际争霸:母巢之战谁 Facebook和牛津大学的研究人员技能 在复杂的视觉环境中导航;还处理不完美信息、记忆和实时游戏中的长期规划,而不是让玩家等待轮到他们
星际争霸 II谁 DeepMind 和其他人技能 规划和优先级设置,类似于早期的 星际争霸 游戏,以及涉及一些世界顶级职业玩家的积极竞争
宇宙谁 OpenAI技能 可视化屏幕上的像素并操作虚拟键盘和鼠标