AlphaGo Zero 能够取得突破的关键瓶颈在哪里( 三 )
■网友
传统的人工智能是从已有的经验(数据)中掌握规律,对训练数据质量要求很高。zero这个确实意义很大。但是围棋棋盘大小固定规则不变,总的来说所有可能可以遍历。但是现实中很多应用可能性几乎是无穷的,变量不断增多规则不断改变,离这个应用还是很远(比如金融,比如打星际)
■网友
按照AlphaGo团队自己发表的论文说:
“AlphaGo Zero与AlphaGo Fun和AlphaGo Lee相比,有一些重要的不同之处。首先,也是最终要的,它只通过与自己博弈进行强化训练,开始于随机对弈,没有采用任何监督及人工数据。其次,它仅使用棋盘上的黑白子作为输入特征。第三,它使用单一的神经网络,而不是相互分离的策略网络和价值网络。最后,它使用一个简单搜索树,依靠这一单一的神经网络评价位置和落子价值,不执行任何蒙特卡罗推导。为了达到上述成果,我们采用了一种新的增强学习算法,该算法将前向搜索结合入训练循环,其结果是快速提升和精确稳定的学习。搜索算法的更多不同,训练程序和网络架构参见Methods。”
推荐阅读
- 汽车很听话|换成了8AT没有OTA的领克01,能够成为爆款吗?
- 「巧克力中富含黄烷醇,能够增强脑部活动能力;因此人均巧克力消费量越高的国家,按人口平均计算的诺贝尔奖得主人数就越多。」这种说法科学么
- 想买个30w—50w的轿车,外形优雅精致,气质沉静内敛。要能够顾家,稳定,安全性能好。请帮忙推荐一下
- 有没有网站能够搜出我给的类似风格图片的网站
- 长寿|同样都是吸烟,为啥日本人能够长寿?医生说出几点不同,值得思考
- 脑干出血ICU住了20天刚刚醒来,最好能够恢复成啥样子
- 哪些资料或者书籍能够帮助全面认识亚马逊公司的经营战略
- 怎样评价GQ中国的文章《乔任梁的半途人生》
- 耳机能够复制小米模式吗
- 趣头条|icon是实用性的家用车,用车的心情也会良好