高校|20+顶尖高校同时开打《王者荣耀》 实际上是一场科研battle( 二 )


而在刚才的例子中,只是展示了学霸们在1V1场景中的科研成果,但其实他们还会有3V3的战斗 。
这种场景对于智能体的挑战就更高了,因为每个智能体仅能获取局部的观测信息,但无法得知其他“队友”或“敌人”的信息 。
这就对合作与竞争、完成特定任务背后的算法,提出了高难度的要求 。
果然,学霸们打个游戏都是如此烧脑 。
……
不过讲真,如此“名场面”还真不是什么新鲜事 。
游戏中搞科研,并不是第一次
其实刚才学霸们的“科研展示”,就是去年中科大和电子科大,在第一届腾讯“开悟”AI大赛上演的一场决斗 。
这场比赛可以说是扩大了社会各界对“AI+游戏”的认知 。
但说实话,在游戏里搞科研这件事,国内外早就有所行动了 。
例如早在2017年,OpenAI“修炼”的智能体,就单挑苦练了半辈子Dota的人类玩家Dendi,最终AI大获全胜 。
高校|20+顶尖高校同时开打《王者荣耀》 实际上是一场科研battle
文章图片
时隔一年(2018年),OpenAI再次派出OpenAI Five,以5V5模式对战人类顶级阵容 。
结果,又是以AI100%胜率告终比赛 。
高校|20+顶尖高校同时开打《王者荣耀》 实际上是一场科研battle
文章图片
当时这样的结果简直是出乎观众的意料之外,就连马斯克在比赛前被问及“谁会赢”,都非常自信地回复到“人类” 。
高校|20+顶尖高校同时开打《王者荣耀》 实际上是一场科研battle
文章图片
与此相关的技术论文也早就有所公布 。
高校|20+顶尖高校同时开打《王者荣耀》 实际上是一场科研battle
文章图片
而除了在Dota2这种5V5团队竞技类型游戏外,“AI+游戏”在其他类型的游戏中也有所渗透 。
例如DeepMind从2017年开始,也频繁曝出在《星际争霸2》这款游戏中碾压人类顶级玩家的消息 。
高校|20+顶尖高校同时开打《王者荣耀》 实际上是一场科研battle
文章图片
DeepMind在这方面的科研研究——AlphaStar,其背后的相关技术论文,更是登上了顶刊Nature 。
高校|20+顶尖高校同时开打《王者荣耀》 实际上是一场科研battle
文章图片
而在国内,对于“AI+游戏”的科研也是如火如荼地进行中 。
例如早在2018年开始,腾讯AI Lab便在《王者荣耀》中持续发力,并与游戏团队打造出了策略协作型AI“王者绝悟” 。
要知道,类似于这样的5V5 团队竞技游戏,单是玩家的动作状态空间便高达1020000 。
这个数字远远大于围棋及其他简单游戏,甚至超过整个宇宙的原子总数(1080) 。
在这三年期间,腾讯AI Lab在与之相关的研究,更是频频登上了AAAI、NeurIPS 等 AI 顶级会议(相关链接附在文末,感兴趣的读者可深入研究) 。
而就在前不久的世界人工智能大会中,“王者绝悟”更是以全英雄达到职业电竞水平亮相 。
在与人类顶级选手的较量中,更是以绝对的胜率惊艳四座 。
高校|20+顶尖高校同时开打《王者荣耀》 实际上是一场科研battle
文章图片
值得一提的是,正是由于腾讯AI Lab在“AI+游戏”领域的技术沉淀,才能够在将其能力“打包”输送给高校的学霸们,也就是我们刚才提到的“开悟”AI开放研究平台 。
……
至此,或许你有一个大大的疑问:
在游戏里搞科学研究,对我们现实生活有什么意义吗?
直接上答案——有的!而且意义非凡 。
游戏,会是下一个AI里程碑的诞生地吗?
是的,这就是业界目前普遍认同的一种看法:
下一个AI里程碑可能会在复杂策略游戏中诞生 。
这种说法并不是空穴来风 。
首先,“AI+游戏”所涉足的大领域,便是强化学习 。
一般来说,强化学习是用于描述和解决智能体在与环境的交互过程中,通过学习策略以达成回报最大化或实现特定目标的问题 。
而一些复杂的强化学习算法,更是在一定程度上具备了解决复杂问题的通用智能 。
但要通过训练,让智能体“炼就”如此能力,正如我们刚才说到的,算法、数据、算力、场景,这四样缺一不可 。


推荐阅读