空枝|这家AI公司的开源项目有望让程序员少加班,Github累积1.6万颗星

OpenMMLab是商汤科技开源的一个计算机视觉领域的AI算法框架 。 自2018年10月逐步开源以来 , OpenMMLab在软件源代码托管服务平台Github上共累积了1.6万个星 。
开发OpenMMLab对于商汤来说意味着什么?商汤对于未来OpenMMLab又会有怎样的发展计划?
为此 , DeepTech对商汤科技联合创始人、香港中文大学信息工程系教授林达华进行了专访 。
OpenMMLab不是一个算法 , 而是一个覆盖了十多个研究的垂直领域 , 共包含100多种算法和600多种模型的算法框架 , 这是“迄今为止最完备的算法体系和框架” 。 目前 , OpenMMLab聚焦的方向包括:图像分类、检测、语义分割、动作识别、3D点云、图像的超分辨率、图像的修补、图像的编辑、人体关键点的检测还有跟踪 。 这些是整个计算机视觉领域最主要的方向 , 也是在实际运用中被最广泛推动的一些方向 。
林达华表示 , 完成一个人工智能算法的开发是一个非常复杂的过程 , 从简单的想法开始到最后的落地 , 有很多工程化方面的问题 , 要花费大量的实践和工程资源 。 “有了OpenMMLab , 那么全球AI方面做研发的时候 , 很多新的想法、创造性的想法、创新性的想法 , 就能够基于这样一个空间和结构顺势形成一个落地的技术 , 大大地加快整个研发的流程 , 这也是商汤这个开源体系对于整个AI产研界的一个贡献“ 。
而在这个过程中 , OpenMMLab也“能够逐渐形成一个非常好的开源生态 , 让很多的想法都可以基于这样一个基础进行充分的交流” 。 比如OpenMMLab框架里的MMDetection , 参与开发的贡献者多达100多位 , 但其中的商汤全职员工只有几个人 , 大部分的其他贡献者是很多社区和研究机构的同学 。 对于商汤来说 , 很多通过这种形式开发出来的算法对于推进人工智能产业赋能有很大的意义 , 而对于开发者来说 , 他们从想法到实现的路径也大大地缩短 。
与行业内其它开源项目相比 , 林达华认为OpenMMLab的最大优势在于成体系化 , 从而降低开发的成本 。 在深度学习时代 , Facebook、Google等公司开发的算法大多是某些垂直方向单点的开源 , 而OpenMMLab基本上覆盖了计算机视觉领域的几乎全部主要方向 。 和单点的算法开源项目相比 , OpenMMLab的整个架构是统一设计的 , 拥有很强的适用性 。
此外 , 开发者在试图实现一些学术论文里面报告的算法的时候 , 往往达不到论文宣称的高精度 。 这是因为 , 对于深度学习来说 , 在训练的过程中有非常多的影响因素 , 要寻找到这个差别、实现报告水平的精度 , 往往一个算法要花几个月的时间来调参 。 而OpenMMLab已经把所有不同算法包到这个代码库里面来了 , 替外部使用者提前“踩坑” , 后者也就不需要再把这些弯路重走一遍了 。
这样一来 , 开发人员在开发自己的项目时 , 就无需重新搭建已经实现的其它算法 。 只需要实现自己的创新的部分 , 哪怕只有两三个函数 , 再把它们直接接入到OpenMMLab的框架 , 和里面的组件进行简单的连接 , 就能形成一个完整的、能落地的项目 。 对于应用开发来说 , 这是非常简便的 。
“这个的话 , 商汤是第一个” , 林达华说 。
对于未来的发展方向 , 林达华希望他们的努力能够逐渐培育出一个生态的体系 , 从单点单个方向的开源和单篇论文的开源 , 逐渐走向整个领域的开源 。 如果得以实现 , 将会极大降低业界产品和项目落地的难度 , 以及缩短科研的路径 。


推荐阅读