微软麻将AI超越人类后,研究团队称有意出教材提升人类牌技( 二 )


还有哪些不足
从此次发表的论文看,Suphx的技术表现堪称完美 。但在两位研究员看来,未来Suphx还有进步的空间 。
“比如我们现在很多时候还是用了高手的数据训练一个模型,然后再到强化学习,但是我们有不同的麻将平台及规则,不一定所有的平台都能拿到人类的数据,在这种情况下怎么能不用人的数据直接从0开始,这是我们在做的一件事情 。”秦涛说 。
相比围棋、象棋以及DOTA游戏,麻将的随机因素很多,这对模型的训练和测试都会带来很大的影响 。据研究团队透露,他们的模型在测试的时候基本上会跑100万场游戏,才能明确地知道谁更厉害,这就跟围棋很不一样,围棋五局三胜,麻将不同 。这种情况下如何更快地完成对弈,得出可信赖的结果,也是团队在研究的一个问题 。
【微软麻将AI超越人类后,研究团队称有意出教材提升人类牌技】 最后,团队还在考虑,Suphx能针对性地,面对不同的对手采取一些自适应策略 。


推荐阅读