|携Science封面，CMU大神Noam博士毕业，论文已公开

【|携Science封面，CMU大神Noam博士毕业，论文已公开】
机器之心报道
作者：杜伟
还记得在双人无限扑克和多人无限扑克中战胜人类顶级玩家的游戏 AI 系统冷扑大师（Libratus）和 Pluribus 吗？近日，这两个 AI 系统的开发者之一、CMU 大神宣布其完成博士论文，并即将从 CMU 毕业。
当地时间 9 月 21 日， FAIR 研究科学家 Noam Brown 在推特宣布其顺利完成了 CMU 博士论文答辩，并公开了长达 230 页的超硬核博士论文《Equilibrium Finding for Large Adversarial Imperfect-Information Games》以及 101 页的 slides 。

本文插图

Noam 在论文前言中表示，除了章节 5.3 中描述的 ReBel 算法，论文中所有其他研究都是与其导师 Tuomas Sandholm 合作完成的。在整个研究过程中， Tuomas 给了 Noam 耐心指导。 Noam 表示，如果没有导师的悉心指导，他肯定不会顺利地完成博士学位。

本文插图

Noam Brown 与其导师 Tuomas Sandholm 教授（右）。
Noam Brown 的博士论文题目为《大型对抗性不完美信息博弈的均衡发现》。不完美信息博弈模拟了多个智能体与私人信息之间的交互。在这一设置下，一个典型的目标是近似一个均衡，其中所有智能体的策略都能达到最优。
完美信息博弈（Perfect-information Games）和不完美信息博弈（Imperfect-information Games）是游戏中信息博弈的两种主要形式。在游戏中，完美信息博弈的前提是所有玩家都知道关于游戏的信息，如规则等；而不完美信息博弈中的玩家对正在玩的游戏没有共同知识，如其他玩家是谁、哪些策略或行动是可行的、结果如何取决于行动等。就难度而言，信息的不完美增加了玩家决策选择的难度，因而博弈分析的难度也更大。
围棋、国际象棋、跳棋等棋类游戏属于完美信息博弈。扑克牌则属于典型的不完美信息博弈，这也是 Noam Brown 一直以来的研究重心。从 2017 年的 AI 系统 Libratus 到 2019 年的新算法 Pluribus ，它们都属于不完美信息博弈的范畴。
在论文中， Noam Brown 对博士期间的一系列研究成果进行了汇总。机器之心对该论文的核心内容进行了简要介绍，感兴趣的读者可以阅读原论文。
论文地址：http://www.cs.cmu.edu/~noamb/thesis.pdf
Slides 地址：http://www.cs.cmu.edu/~noamb/thesis_slides.pdf
博士论文简介
这篇博士论文详述了大型对抗性不完美信息博弈中均衡计算的一系列进展。这些新技术使得 AI 智能体首次有可能在无限注扑克游戏中击败顶级职业玩家，而这正是几十年来 AI 和博弈论领域一直存在的重大挑战性难题。

本文插图

反事实遗憾最小化（CFR）的改进
作者首先介绍了对反事实遗憾最小化（counterfactual regret minimization, CFR）做出的改进，这是一种在双人零和博弈中收敛至纳什均衡的迭代算法。此外还描述了 CFR 的新变体，它们利用折扣原则（discounting）来显著加快收敛速度。

本文插图

CFR 方法。
然后，作者介绍了理论上合理的剪枝（pruning）技术，这些技术可以在大型博弈中呈数量级地加快收敛速度。

本文插图

|携Science封面，CMU大神Noam博士毕业，论文已公开

推荐阅读

红茶跟大红袍的区别,大红袍于红茶的区别

「平凡寥寥生活」身上这三种“体质”很明显，占一个你都很厉害了，真正优秀的人

金字塔里面有什么埃及金字塔里面有什么

厦门：厦门成立台胞医保代办服务站

悟世间百态|自制粉蒸肉、番茄鸡蛋汤，今天的晚饭是交通日主题吗？

房价|未来10年，中国“最贵重”的不再是房子，这2个行业更有“钱途”

怎么在家学英语？

广州市|广州市中心有个相亲角，优质对象，女性比例极高，父母：操心

骨鲠在喉|却因“天价”电费不敢住，物业你是在开玩笑吗，女子花90万买房

内蒙古锡林郭勒盟一矿发生井下车辆事故已知20死30伤

雪儿小姐的情书|一般情况下，会给你三个“连续”，女人想念你到极致

互联网“互联网+新动能”威海食博会搬上“云端

新射雕英雄传|《新射雕英雄传》开机，演员阵容曝光，主角实力还不如配角

中新经纬|【财经早汇】二三线城市房贷现收紧迹象，部分银行暂停房贷业务

清华人看《无问西东》是啥感受

简单观察|A股不会出现大阴线，午后

新年快乐！特斯拉疯了，Model Y降价16万

50㎡居然能做两房，还有衣帽间，小户型就该这么装，真心实用

『人民日报客户端』44+1！任何一个1都不能大意！

表演系艺考舞蹈时必须是民族舞吗