人工智能|征战《指环王》游戏,这次人工智能学会了合作

◎采访人员 翟冬冬
人工智能(AI)又来征服游戏了 , 这次是《指环王》 。 不同于我们所熟悉的《指环王》电影 , 游戏《指环王》是由美国游戏开发商Fantasy Flight Games于2011年推出的一款纸牌游戏 , 目前在全球拥有数百万玩家 。 近日 , 波兰华沙理工大学的两位学者在线发表的一篇论文显示 , 基于蒙特卡罗树搜索(MCTS)技术 , 他们开发出了一位人工智能虚拟玩家 。 实验显示 , 这位基于MCTS技术的虚拟玩家游戏胜率明显高于专家级段位的人类玩家 , 且其胜率会随着游戏的复杂度而增加 。
需要合作而非对战
随着机器学习算法的不断发展 , 许多计算机科学家开始训练AI模型 , 让其在不同游戏中与人类玩家对战以测试模型性能 。 从1997年5月“深蓝”计算机战胜顶级国际象棋选手卡斯帕罗夫 , 到2016年3月谷歌计算机围棋程序“阿尔法围棋”战胜韩国棋手李世石 , AI不断刷新游戏“副本” 。 此后AI还在六人桌德州扑克比赛、策略类游戏《星际争霸》等游戏中战胜人类职业选手 , 可以说现在的AI除了懂得逻辑推演、还会实时分析敌情并作出决策 。
但在《指环王》中 , AI的任务是合作 , 而非对抗 。 与其他著名的纸牌游戏如《炉石传说》等相比 , 《指环王》的游戏模式有着很大的不同 。 《指环王》的中心策略是团队合作 , 而不是与其他玩家竞争 。
研究人员发现 , 在此之前 , 并无一款AI模型适用于《指环王》这款游戏 。 这主要是因为游戏的合作特性 , 并且这种游戏的决策过程非常复杂 , 游戏玩法包括多个阶段 , 其中大部分玩法策略要取决于前一阶段的结果 。
尽管面对上述挑战 , 两位学者还是在MCTS技术的基础上成功开发出了一款可应用于《指环王》的算法模型 。 MCTS技术是一种通用的启发式决策方法 , 可以在随机游戏中优化给定游戏或场景搜索解决方案的空间 。 通过这种方法 , AI模型学会了在复杂的游戏中进行协作 。 未来AI有望与人类合作 , 一起玩《指环王》游戏 。
游戏与AI相互促进
事实上 , 游戏与AI的合作由来已久 。 在战胜人类选手以前 , AI早已用于游戏开发 , 以提高游戏性能、降低开发难度 。
在游戏机制方面 , 人工智能技术的应用已屡见不鲜 。 由AI所控制的模型往往扮演着玩家的“对手” , AI的加入使游戏的可玩性大大提高 , 让游戏的关卡更具挑战性 。
早在1992年 , 《德军总部3D》中的士兵角色就使用过一个基础的人工智能模型 。 该智能机制主要借助有限状态机(Finite State Machine)来实现 。 游戏设计者首先根据游戏场景创建若干士兵角色可能经历的所有事件列表 , 然后为士兵角色设定每一事件的具体响应 , 游戏中士兵角色按照事先设计好的代码去执行响应 。 这种人工智能的实现方式较为简单 , 依赖于简单事件“触发—响应”机制 。
随着人工智能的发展 , 如今游戏中的人工智能已不再局限于有限状态机 。 如上述提到的MCTS等技术的加入 , 使游戏中AI表现的更具有随机性 。
如今电子游戏的复杂度越来越高 , 画质、剧情和互动反馈等方方面面都不断被优化 。 但这也导致想要确保它们的可玩性和无缺陷变得越来越困难 。 近日 , 知名游戏大厂艺电公司(EA)的人工智能研究人员发表的一篇论文 , 探讨了深度强化学习在帮助测试游戏方面的应用 , 以期望将更多人从重复性测试工作中解放出来 。
而根据媒体报道 , 2017年 , 知名游戏厂商育碧已经建立了相关AI实验室 , 致力于通过游戏数据进行人工智能方面的研究 。 从《刺客信条》到《看门狗》系列 , 育碧的游戏一直以还原真实城市、地标而被玩家津津乐道 。 他们游戏中的城市模型主要通过长期实地拍摄、测绘等方式获得数据 , 这些数据也被用在了实验室关于AI自动驾驶的研究上 。