DeepMind新AI无需提前知晓规则也能掌握游戏：无论视觉简单还是复杂据外媒报道

据外媒报道， DeepMind的使命是向人们展示，人工智能不仅能够真正精通游戏甚至在不需要被告知游戏规则也能做到这一点。该公司最新的AI代理产品MuZero不仅可以通过具有复杂策略的视觉简单游戏如围棋、国际象棋和日本将棋实现这一目标，还可以通过视觉复杂的雅达利游戏实现这一目标。
文章插图
DeepMind的早期AI的成功至少在一定程度上得益于巨大决策树的非常有效的导航，这些决策树代表了游戏中可能的行动。在围棋或象棋中，这些树则是由非常具体的规则控制，如棋子的移动位置、这个棋子移动时会发生什么等等。
在围棋比赛中击败世界冠军的AI AlphaGo在研究人类棋手之间和对手之间的比赛时了解了这些规则并把它们牢记于心从而形成了一套最佳实践和策略。它的续作AlphaGo Zero则在没有人类数据的情况下就做到了这一点。 AlphaZero在2018年对围棋、象棋和将棋也做了同样的事情并由此创造了一个可以熟练玩所有这些游戏的AI模型。
但在所有这些情况下， AI都获得了一系列不变的已知游戏规则并围绕着这些规则创造了一个框架去创造自己的策略。
文章插图
DeepMind在一篇关于他们新研究的博文中指出，如果AI提前被告知规则， “这就很难将它们应用到混乱的现实世界问题中，这些问题通常都很复杂且很难提炼成简单的规则。 ”
该公司的最新进展是MuZero ，它不仅可以玩上述游戏还可以玩雅达利的各种游戏，且完全无需任何规则手册。最终的模型不仅通过自己的实验（没有人类数据）甚至没有被告知最基本的规则就学会玩所有这些游戏。
【DeepMind新AI无需提前知晓规则也能掌握游戏：无论视觉简单还是复杂】MuZero并没有使用规则去寻找最佳情况，而是学会考虑游戏环境的方方面面并自己观察它是否重要。在数以百万计的游戏中，它不仅学会了规则还学会了位置的一般价值、领先的一般政策以及事后评估自己行为的方法。据悉，后一种能力能帮助AI从自己的错误中吸取教训、重新开始并尝试不同的方法进而进一步完善位置和策略价值。

DeepMind新AI无需提前知晓规则也能掌握游戏：无论视觉简单还是复杂

推荐阅读

高旻说娱东@吴宣仪是同性恋？吴亦凡绯闻女友签约哇唧唧哇？娜扎使坏放飞自我

星座听语|纠纠缠缠，情比金坚，你是唯一，把爱相拥，爱到天荒地老，8月

万能作文模板(万能作文开头和结尾)

冷空气|立冬过后，冷空气来袭！全国感冒地图了解一下

去汗蒸馆汗蒸的步骤

你的老师同学做过哪些别人看上去可能不是啥大事但让你非常生气的事

交易▲一个困扰着散户的疑问：股市里的庄家知道每个散户持仓多少吗？

凯叔父育子|五天一大病”？做好这几件事，娃的抵抗力杠杠的，“三天一小病

防暑|【抗洪慰问】清凉解暑，来一碗爱心绿豆汤

养生知识每日说▲男性把这5种食物当零食吃，增强肾动力，“天然雄性激素”找到了

|洗衣机放阳台没那么简单，入住后这几个小问题能让你想哭

绿沙窗户怎么清理厨房纱窗怎么清理

「看齐」纯原创设计u002F豪华科技集于一身，【齐齐哈尔汽车资讯】众泰TS5内饰首曝

种族歧视|美国教授说了一个中文词引发黑人学生不满被控种族歧视

感恩节的5个传统食物感恩节食物

中国新闻网|呼和浩特一幼儿园孩子身上现针眼三名嫌疑人被刑拘

常见的erp系统品牌什么是erp系统软件

问董秘|投资者提问：民航机场可以做免税业务吗

茶叶后期怎么管理栽培，该怎么规划化种植茶叶

馒头面条升糖快，北方的糖友该怎么吃？这样做，让血糖平稳易控制