谷歌AI又获重大突破！新算法无需了解规则也能自学成“棋” 科技日报记者冯卫东据最新一期《自然》

科技日报采访人员冯卫东
据最新一期《自然》杂志报道， DeepMind公司开发的一种AI算法MuZero ，可以在不告知其游戏规则的情况下掌握围棋、国际象棋、日本将棋和视频游戏，这是谷歌人工智能部门获得的又一重大突破。
文章插图
DeepMind 公司表示，研究人员多年来一直在寻找一种方法，既可以学习建立用于解释当前环境的模型，也能够利用这个模型来进行最好的决策。到目前为止，大多数方法都难以在Atari这种游戏中进行有效规划。
MuZero最初在2019年推出，通过只关注环境中最重要的一个方面，来学习建立模型并解决问题。通过将这种方法与阿尔法狗强大的搜索树技术相结合， MuZero的能力实现了重大飞跃。此外， MuZero 还利用了前瞻搜索、基于模型的规划来解决问题。
文章插图
MuZero不会使用规则来找到最佳情况（因为事先不被告知），而是学习考虑游戏环境的各个方面，自己观察它是否重要。在数百万场比赛中，它不仅学习规则，而且学习位置的通用价值，成功的通用策略以及事后评估自己行为的方式。后一种功能可帮助其从自身的错误中学习、回忆和重做游戏，以尝试各种不同方法来进一步优化位置和策略价值。
文章插图
【谷歌AI又获重大突破！新算法无需了解规则也能自学成“棋”】MuZero不仅在国际象棋、围棋和日本将棋上达到了与提供完善规则的阿尔法狗一样的超人水平，在Atari游戏这样的杂乱感知输入环境中也创造了新纪录。研究人员将MuZero描述为“在追求通用算法方面迈出的重要一步” 。
编辑：刘义阳

谷歌AI又获重大突破！新算法无需了解规则也能自学成“棋”

推荐阅读

高旻说娱东@吴宣仪是同性恋？吴亦凡绯闻女友签约哇唧唧哇？娜扎使坏放飞自我

星座听语|纠纠缠缠，情比金坚，你是唯一，把爱相拥，爱到天荒地老，8月

万能作文模板(万能作文开头和结尾)

冷空气|立冬过后，冷空气来袭！全国感冒地图了解一下

去汗蒸馆汗蒸的步骤

你的老师同学做过哪些别人看上去可能不是啥大事但让你非常生气的事

交易▲一个困扰着散户的疑问：股市里的庄家知道每个散户持仓多少吗？

凯叔父育子|五天一大病”？做好这几件事，娃的抵抗力杠杠的，“三天一小病

防暑|【抗洪慰问】清凉解暑，来一碗爱心绿豆汤

养生知识每日说▲男性把这5种食物当零食吃，增强肾动力，“天然雄性激素”找到了

|洗衣机放阳台没那么简单，入住后这几个小问题能让你想哭

绿沙窗户怎么清理厨房纱窗怎么清理

「看齐」纯原创设计u002F豪华科技集于一身，【齐齐哈尔汽车资讯】众泰TS5内饰首曝

种族歧视|美国教授说了一个中文词引发黑人学生不满被控种族歧视

感恩节的5个传统食物感恩节食物

中国新闻网|呼和浩特一幼儿园孩子身上现针眼三名嫌疑人被刑拘

常见的erp系统品牌什么是erp系统软件

问董秘|投资者提问：民航机场可以做免税业务吗

茶叶后期怎么管理栽培，该怎么规划化种植茶叶

馒头面条升糖快，北方的糖友该怎么吃？这样做，让血糖平稳易控制