深度|商汤CEO徐立:包容、长尾、开放,AI创新的三个策源力( 四 )


深度|商汤CEO徐立:包容、长尾、开放,AI创新的三个策源力
文章图片

这些技术的实用价值还有待进一步挖掘 , 但是人工智能真的还能做更多有意思的事情 。
比如MMEditing框架 , 能够实时从大家跳舞的动作中抽取骨架 , 并且是一个稳定的骨架搜索 。 那么我们在做运动的时候 , 就可以很精确地把骨架进行分析 。 下图中间是一名冰壶运动员在清理地面时的一个动作抽取 , 当这些问题都能很轻松地提取结果时 , 我们很多的运动分析和判断都能够通过机器来完成 。
深度|商汤CEO徐立:包容、长尾、开放,AI创新的三个策源力
文章图片

还有一些语义上的编辑 , 比如说要生成一只猫 , 上面最右侧的图片是我们用GAN算法生成的 。 生成这只猫的过程中 , 我们现在可以加入很多语义的控制量 , 比如让猫大一点 , 猫头大一点 , 耳朵长一点 , 眼睛大一点 , 这些诸多变量的变化都可以通过语义来控制生成的过程 , 并且是用一个解析的方式真正地完成猫的生成过程 。
试想一下 , 除了刚才编辑真实的内容之外 , 我们还可以在环境当中去生成我们任何想要的 , 比如卡通人物照片里面的脸形、眼睛的大小、发型的变化 , 都能够通过语义的调节来进行新的生成 。
还有PS照片 , 对于单张照片我们可以比较容易通过各种软件进行编辑 , 对于实时的视频 , 我们现在也可以很轻易地做到这一点 。 用这样一个简单的方法 , 就能把你不想要的东西给清除了 。
深度|商汤CEO徐立:包容、长尾、开放,AI创新的三个策源力
文章图片

在拍摄的视频场景中 , 如果有一些不小心进入画面的人或物体就可以轻易地给抹去 。 未来 , 人工智能能够很便捷地大规模生成各式各样符合观众习惯的视频和内容 。
开源框架OpenMMLab
以上提到的这些都是在一个框架中 , 一个开源的框架 , 叫OpenMMLab 。 MM代表的是多媒体(Multimedia , 不是MingMing , 也不是MeiMei) , 解决的是多种媒体的融合 。
1个算法的框架 , 10多个研究垂直领域 , 100多种算法和600多种预训练的模型 , 商汤和香港中文大学-商汤联合实验室一起推出了迄今为止最完备的算法体系和框架 。
深度|商汤CEO徐立:包容、长尾、开放,AI创新的三个策源力
文章图片

我们从2018年10月份开源第一个框架算法到现在 , 两年多时间 , 已在GitHub收获了16895个星标 , 是全中国所有开源框架当中星数最多的 。 除此之外 , 我们还会有更多的这样框架上线 。
深度|商汤CEO徐立:包容、长尾、开放,AI创新的三个策源力
文章图片

虽然我们开源的时间只有短短两年 , 但任何一个框架都经过了非常长时间的积累 。
以图像编辑来说 , 我们在2014年时推出了全世界第一套用深度学习做超分辨率的框架 , 放到了MMEditing中 。
今天 , 我们累积了大量的学术论文和学术成果 , 让这套框架开源 , 使得很多学术的比较、最好的最先进的算法框架的实现 , 都能够在其中完成 , 让研究人员能够更好地与传统算法做比较 , 和最优秀的算法做比较 , 让工业界能够很快地上手去完成第一步的启动 。 这是我们推出开源框架的一个核心的作用 。
深度|商汤CEO徐立:包容、长尾、开放,AI创新的三个策源力
文章图片

很多时候 , 大家如果要去找一棵大树的时候 , 都会想到去森林里面找 , 所以人工智能也是一样 。 人工智能的细分场景和细分应用非常多 , 我们一定要去拥抱这样一个开放共创的生态 , 我们要的不是一棵独木 , 我们要的是一片森林 , 所以最关键的一个创新驱动力叫做“开放” 。
▎总结:人工智能创新的三个策源力 我们来总结一下刚才所讲的三个创新策源力 。
第一 , 我们要做的是包容 , 我们不能对算法求全责备 。
很多人可能会问这样的问题:我要检测某个场景下的问题 , 准确率只有80% , 能不能使用?
其实 , 我们可以换一种角度思考 , 它不是丢掉了20% , 是检测出了80% 。 还以刚才的粪车偷排为例 , 如果这套系统上线 , 准确率只有80% , 但却能把八成的粪车偷排检测出来 , 实际上已经很大推动了行业的变化 。 可能大众的观点还在于说依然有两台车没有被检测出来 , 但这就是随着时间的推进 , 有了这样的一个包容过程 , 才能够真正起到迭代的价值 , 就好像那匹四蹄腾空的马 。
第二 , 我们要解决长尾行业应用的实现 。 我们不能再只聚焦在头部的应用中 , 人工智能不能只为一个亮点、解决一个核心的问题 , 真正要做到效率的提升 , 是需要我们把大量的细节问题给解决 , 魔鬼在细节中 。
第三 , 我们要的是一片森林 。 我们需要各种各样的生物 , 需要开放创新 , 这也是我们迈出的第一步 , 我们开源了这样的算法框架 , 未来会引入更多的生态系统来共同完成 。


推荐阅读