|启元星际AI挑战顶级职业选手,我们将进入智能体时代?
本文插图
2017年5月,在乌镇围棋峰会上,AlphaGo三局连胜世界排名第一的中国棋手柯洁,成为人工智能发展史上的经典一役 。
三年后,中国人工智能平台公司启元世界将摆下另一场擂台,向人工智能领域的更高峰——《星际争霸》发起挑战 。
相比于已经被AlphaGo彻底征服的围棋,《星际争霸》是一块更加难啃的“硬骨头”,即使与AlphaGo师出同门的AlphaStar也尚未彻底征服人类职业选手 。
AlphaStar与人类职业选手的第一次对战放出的是测试比赛录像,并在一盘现场对战中失利 。 后来AlphaStar为了防止被职业玩家抓住漏洞,匿名参加《星际争霸II》欧洲天梯对战系统,在与大师和宗师级选手的比赛中互有胜负 。
2020年6月21日下午2点,启元“星际指挥官”AI将迎战人类顶级职业选手,《星际争霸I/II》全国冠军黄慧明(TooDming),还将与首位晋级世界锦标赛全球总决赛的中国大陆选手、2018年《星际争霸II》黄金总决赛冠军李培楠(TIME)交手 。 这将是全国首次现场直播星际AI与人类顶级职业选手的对战 。 这场启元星际AI顶级职业选手挑战赛也是2020北京智源大会的系列重磅活动之一 。
本文插图
在AlphaGo称霸围棋棋坛之后,DeepMind把重心转移到了《星际争霸》上来 。 Facebook、腾讯等科技巨头近年来也都全力押注这条赛道 。
作为有史以来最成功的即时战略游戏,《星际争霸》可谓人工智能的“巅峰挑战” 。
相比于回合制的围棋,《星际争霸》是即时对抗类游戏,必须做出毫秒级决策;相比于围棋在361个落子点之内的选择和完全信息可见,《星际争霸》的决策空间高达10的26次方并充满了战争迷雾;相比于《DOTA2》、《王者荣耀》的5对5英雄对战,《星际争霸》涉及200个单位的战役、战术策略博弈和经济、科技发展决策,所以对AI极具挑战性 。
《星际争霸》考验的是AI全方位的综合能力,既要能看得懂游戏态势,又要能深刻理解敌我局面,还要在正确的时间做出正确的决策,根据对方行动随机应变 。 这要求AI不仅能实时感知、认知环境,还需要适应环境,做出数千步连续决策以求得胜利 。
所以,通过《星际争霸》训练出来的AI更接近各个行业真实的应用场景:环境复杂多变、策略空间巨大、响应时间实时,而AI可以在此类复杂场景中甄别、提取有效信息,在信息不完全情况下进行推理和决策 。
业内把AlphaGo、AlphaStar、“星际指挥官”这一类具备自我学习、自主决策能力的AI叫做智能体(Agent),它是人工智能技术的集大成者,在虚拟世界表现为数字人,在实体世界表现为机器人 。
启元世界自2017年8月创立以来,致力于创造伟大的智能体产品,并把智能体带入每个行业、每个家庭、每个人,提升产业效能和生活体验 。 公司团队核心成员来自BAT、Netflix、IBM、香港科大、伯克利等国内外知名高科技企业和一流学府,屡获NeurIPS、CVPR等国际竞赛大奖 。
值得一提的是,作为一家创业公司,启元世界仅使用了DeepMind AlphaStar 1%的算力,就已经达到人类顶级高手的水平,并敢于在公平设定下(与人类选手近似的APM操作限制),在线下公开与顶级职业选手进行实时对战 。
本文插图
启元AI“星际指挥官”进化之路
启元“星际指挥官”仅需几千局的小样本做启动,就能让智能体通过模仿高手、超越高手达到人类顶级选手水平 。 这意味着,在缺乏大数据积累的很多行业,如智能制造、能源优化、网络调度,智能体也有着广阔的落地空间 。
正如DeepMind一样,在《星际争霸》中彻底战胜人类,并不是启元世界的终极目标 。 《星际争霸》只是启元在虚拟世界训练智能体的一块“试验田”,最终的目的是训练出具备自我学习、自主决策能力的智能体,利用新一代人工智能技术,帮助客户解决博弈、优化、控制等复杂环境下的动态决策问题 。
推荐阅读
- 科学|高清镜头带您看一下SpaceX正在紧锣密鼓建造中的SN5星际飞船原型
- 科学|3亿公里外带回星际物质,“隼鸟”将成最远距离返回的人类探测器
- 羽度非凡|颠覆传统冰箱品类,西门子重新挑战高端市场,让生活更精致!
- 南方周末|首个星际天体起源之谜新解
- InfoQ|Google早已看到未来多容器的挑战,利用Anthos能否实现多集群统一管理?
- 球谈江湖|小米5G重拳出击:120Hz+骁龙865plus+1.08亿四摄,挑战华为Mate40
- 徐明星|徐明星无视法律挑战底线
- 群众网|徐明星无视法律挑战底线
- 中年|又一物联网传输技术崛起,对现有技术发起挑战
- 金融|盘点了十几个流动性挖矿项目 我们发现了这些趋势和挑战