离开阿里创业后融资上亿,为何莉莉丝等大厂会青睐他们的AI技术?( 二 )


在今年China Joy参展之后 , 龙海涛明显感受到来自游戏厂商的关注 , 包括莉莉丝等来自上海、广州的一线大厂 , 原因在于新一代游戏AI设计的需求在变多 。
游戏AI存在了非常多年 , 但传统游戏AI设计至今一直鲜有变化 , 与游戏图形技术的高速进化形成了鲜明的对比 。 “传统游戏AI依靠行为树的规则来设计 , 它的弊端在于规则是写死的 , 当游戏复杂度超出程序员设定的框架 , AI就不知道该怎么办了 。 ”
所以基于行为树 , 既不能写出能战胜柯洁的AI , 更不可能写出能通过经验反馈不断自我学习、还能表现出高维度即时策略的复杂智能体 。 这就好比是很多竞技游戏中的“人机”、“机器人” , 它们并不像人 。
启元团队发现 , 其实大家对AI的强度并没有太高的追求 , 但对它的拟真度、真实性会有很高的要求 , 这恰好是模仿学习、强化学习、演化学习的强项 。
比如在训练启元星际AI的时候 , 他们实现了260种TvT(指《星际争霸II》人族内战)的战术 , 包括开局打法、兵种组合 , 以及多种即时性的随机应变策略等 。 它的拟真度 , 高到足以让职业选手无法分辨真伪 。
离开阿里创业后融资上亿,为何莉莉丝等大厂会青睐他们的AI技术?文章插图
在之前举办的比赛上 , 《星际争霸I/II》全国冠军黄慧明打完以后告诉他们 , 说完全看不出像机器人 , 还用“像一个贱贱的高手”来形容启元AI:“看起来操作不太行 , 有失误 , 觉得自己是有机会的 , 但实际打上去又打不过 。 ”很多职业选手与启元AI切磋之后 , 同样有这种被下了套的感觉 。
不过这只是AI的一面 , 启元AI的泛化能力也很强:“由于AI可以不停地学习 , 只要算力足够 , 它就可以覆盖很多的场景 , 套路更多 , 也会更加灵活 。 ”
这样的AI , 放到游戏里能做什么?
与数十家一线游戏厂商交流之后 , 启元团队收到了很多的建议 , 比如大DAU产品冷启动、新手过渡保护、加速匹配、掉线托管等方面 。 还有模拟战局、大体量数据的平衡性调试 , 以及PVE活动设计、玩家行为分析等方方面面 。
从目前已有的合作案例来看 , 启元AI具体有两个方向的应用:虚拟玩家陪玩和线下数值测试 。
虚拟玩家陪玩 , 是目前厂商反馈中最普遍的一类应用模式 。 在前面对抗星际顶尖选手的时候 , 启元AI用的是训练了上千万对局的智能体 , 但在训练中的每个阶段 , 启元AI都可以调用出不同水平、不同风格的智能体 。
“在线下训练的时候 , 智能体会自己打足够的时间 , 通过自我对抗来提升水平 , 我们会设置类似天梯的规则 , 让智能体打出不同的水平 。 这时候我们会计算一个分值 , 来区分不同水平的智能体 , 然后用人工校准一下 , 来对齐现实玩家的段位水平 。 ”
这时候 , 尽管智能体的最终目标都是取胜 , 但不同段位不同局面之下 , 它会体现出猥琐、激进、稳健等不同的风格和打法 。 将这些智能体部署到服务端 , 通过调节参数调用的方式 , 就可以生成对应段位、打法、风格的智能体 , 成为一个虚拟的玩家 。
在这个基础上能做的事情就非常多了 。
首先是大DAU产品的冷启动 。 对于大DAU游戏而言 , 前期用户体量决定游戏给人的热度和匹配体验 , 而如今买量成本高居不下 , 适度投放虚拟玩家就可以降低启动门槛 。
据了解 , 由于服务端的部署采用了团队擅长的分布式架构、在线服务器集群等设计 , 所以现在他们可以做到智能体的大规模并发服务 , 这带来的益处是成本的大幅度降低:“一个虚拟玩家的成本差不多只有真实玩家获客成本的几十分之一 。 ”
其次可以实现更好的新手保护机制 。 在上手门槛较高的游戏里 , 再加上竞技游戏老手炸鱼的问题 , 往往给新手的体验会很差 , 匹配AI就可以很好地保护新手体验 。 而虚拟玩家比常规AI的拟真度高出很多 , 当玩家察觉不出是否为真人的时候 , 保护机制带来的体验就会更好 , 最终这些正向反馈 , 都会提高游戏的新手留存率 。


推荐阅读