离开阿里创业后融资上亿,为何莉莉丝等大厂会青睐他们的AI技术?


离开阿里创业后融资上亿,为何莉莉丝等大厂会青睐他们的AI技术?文章插图
技术是产品想象力的基石 。
文/依光流
假如给你的游戏安排一个7x24小时不吃不睡 , 能打出高中低水平 , 运用成百上千种风格和策略的虚拟玩家 , 你会用它来做什么?
在三年前创业的时候 , 袁泉和龙海涛并没有什么明确的设想和答案 , 他们只是看中了AI兴起的趋势 , 从阿里出来创办了新公司启元世界 。 游戏圈的朋友可能不太了解 , 这两位都是大神级的科学家 , 在阿里留下了辉煌的战果 。
袁泉曾在阿里认知计算实验室担任负责人、资深总监 , 缔造了手机淘宝、手机天猫的推荐算法 , 是阿里算法技术的P10科学家 。 龙海涛曾是IBM中国研究院研究员 , 在阿里期间从事搜索广告业务的架构设计 , 主导了离线系统、在线引擎和搜索内核的升级换代 。
今年6月 , 启元世界研究的星际AI以两个2:0的成绩击败了《星际争霸I/II》全国冠军黄慧明(TooDming) , 以及黄金总决赛三连冠选手李培楠(TIME) , 也意味着中国星际AI首次在公开比赛中战胜国内顶级职业选手 。
离开阿里创业后融资上亿,为何莉莉丝等大厂会青睐他们的AI技术?文章插图
拿到这样的成绩之后 , 启元世界也越发被资本关注 。 目前 , 该公司已累计获得上亿人民币融资 , 由高榕资本等知名机构投资 。 不仅如此 , 不少一线游戏厂商也看中了启元AI的应用前景 。
从今年起 , 启元团队陆陆续续接触了不少一线游戏厂商 , 发现大家的需求和想法远高于预期 , 有的厂商则已经开始实际投入运用了 。
“会决策”的新一代AI
几年前 , AI领域正是AlphaGo火爆的时候 , 对启元的创始团队而言 , 它就像是打开了一个新的窗口:“不需要大量的标注数据 , 就能训练出一个打败世界冠军的AI 。 ”看到这个契机 , 他们决定离开阿里自行创业 , 并选择了决策智能和强化学习方向 , 用《星际争霸II》来尝试技术突破 。
与人脸识别等AI选择的监督学习技术不同 , 强化学习要求AI像人一样 , 能做出连续的动态决策 。
举个简单的例子 , 同样是面对猫和狗的两类数据 , 监督学习会对数据标注“猫”和“狗”的标签 , 让AI进行分类学习 , 然后用未标注的数据 , 让AI辨别 , 最后通过神经网络的结合 , 优化AI的识别效率;强化学习则不会具体标注是“猫”还是“狗” , 同时还需要训练出的AI看到猫以后 , 能做出“撸猫”的决策 , 看到狗还会做出“上前逗一逗它”的决策 。
这种更高门槛的技术要求 , 带来了不少的难题 , 也使得业内挑战这一领域的团队偏少:从商业化的角度考虑 , 这套技术的成本一定要控制在比较低的水平 , 否则成本降不下来 , 无法大规模商业化 。
从技术底层的角度来看 , 首先强化学习需要很大的算力 , 算力的组织如果做的不好 , 实现的效果会产生几个数量级的差距;其次是算法需要结合具体的应用场景做大量的最佳实践积累;第三是整个团队的专注和极致深耕能力 。
好在 , 启元世界在强化学习领域起步早 , 核心团队在BAT、Netflix、香港科大等一流的工业场景和研究平台上积累了多年 , 他们渐渐积累了一支近百人的技术团队 , 专攻这一方向 。 而为了让启元AI达到现在《星际争霸II》的“职业玩家”水平 , 他们做了几百组的实验 , 来筛选和优化合适的算法 。
离开阿里创业后融资上亿,为何莉莉丝等大厂会青睐他们的AI技术?文章插图
去年底在加拿大NeurIPS 2019会场上 , 启元星际AI首次公开
经过三年的打磨 , 终于攻克了这些难关 。 现在启元AI相比海内外大厂的同类AI , 基本可以节省一到两个数量级的算力 。 有了这套底层的技术 , 启元AI才能在今年6月战胜国内星际顶级选手 。


推荐阅读