CSDN|GitHub 标星 20000+,国产 AI 开源从算法开始突破 | 专访商汤联合创始人林达华( 二 )
超大模型会成为未来的AI基础设施? CSDN:CV 领域有哪些令人兴奋的技术或者应用突破? 林达华:自然语言处理领域的 BERT、GPT 等引起了学术界和产业界巨大反响 。 现在的AI生产模式是遇到一个新的场景 , 就需要重新积累数据 , 收集数据 , 训练一个新的模型 , 成本高昂 。 但是从长远来说 , 我们也在一直在探索 , 在 CV 领域能不能有类似于 GPT 这种非常强有力的预训练模型 。受到 NLP 领域的启发 , CV 领域已经开始有人在探索有没有能够适用于多项应用的预训练模型 , 在不需要迭代或者非常短时间迭代的前提下 , 就能够达到实用水平 。我们已经在探索一些新模型训练的方式方法 , 经过短周期的迭代 , 就能够满足大量新型应用的性能要求 。 但是做这方面研究的机构不是很多 , 因为大模型的训练花费需要非常大的算力支撑 , 训练一次的花费也是非常高昂的 。 商汤在建设大型的人工智能计算平台 , 一方面支撑产业赋能 , 另外一方面支撑技术的突破 。 我们实验室在这方面已经取得了一些初步的成果 , 可能在下次的会议上 , 就会看到我们的进展 。此外 , 我们也在积极探索各种无监督、半监督、弱监督方法 , 以及通过把模型和各种环境因素结合在一起的方法 , 来降低对标注数据的依赖 。 在今年的 ECCV , 我们的多篇论文就体现了我们在这个方向所取得的成果 。CSDN:模型越来越大越来越深 , 这是未来的必然的发展方向吗?它会怎样影响AI生态? 林达华:科研是一个非常多样化的领域 , 随着超大模型的涌现 , 如果他们的价值真正能够在广大的场景里面得到验证 , 会对未来的科研分工模式带来新的变革 。整个科研链条在不同的阶段都需要创新 , 在应用领域需要创新 。 当GPT出来之后 , 它只是一个基础的模型 , 然而有很多人用非常创造性的方法来使用这个模型 , 所以应用层可以有很多创新 。 而有算力资源的人 , 也可以对这个模型做一些简单的迭代 , 应用到某种比较新奇的领域 。我其实并不认为全社会和整个科研界都是需要训练大模型 。 未来整个科研分工可能会有新的改变:少数有充足计算资源和工程能力的大型研究机构或者企业会在核心模型上进行竞争 , 并且把这些模型能力开放出来作为基础设施 , 而更多的AI研究者或者从业者则会站在巨人的肩膀上在应用侧进行多种形式的创新 , 解决产业和生活中的各种场景问题 。
大牛回归学术界 , 是好是坏? CSDN:一些著名科学家开始从企业回归学术界 , 是否意味着 AI 科研和工程落地之间存在巨大的鸿沟?商汤内部是如何考核科研的成绩并做好平衡的?林达华:随着 AI 业务越做越深入 , 可能在 AI 发展的初期 , 算法研究员起到了非常大的推动作用 , 但是随着各个行业AI技术的成熟 , 行业需求愈发突显 , 包括商汤在内的企业 , 商业、产品、运营等人才的作用越来越重要 , 但是技术创新依然是最重要的源动力 。为了把 AI 推广到更多的行业 , 需要在技术方面有新的突破 。 这时有一部分科学家看到这些问题的存在 , 但是在企业里不一定可以花很长时间投入很多资源去做 , 对于这些更长期的更具探索性的研究 , 高校或者大型实验室是可以发挥很大作用的 。 所以 AI 真正持续长时间的健康发展 , 一定需要产学研的有机结合 。要解决现在 AI 数据成本等方面的根本问题 , 需要核心技术的突破 。 如果一个科学家从未在企业里待过 , 他看不到问题在哪里 。 那些在企业界待过的科学家再回归学术界 , 其实也能带来一些对整个产业发展真正有价值新思考 , 引领学术跟产业的融合 。商汤对这种事情一直处理得非常好 , 我们和很多高校实验室都有天然的联系 , 包括我在内的研究leader都在研究机构和高校里扮演很重要的角色 , 这样就能够在带动高校研究资源的同时 , 与企业的联动也更加紧密 。
推荐阅读
- CSDN|CSDN”好师父“培养高素质技术人才
- CSDN|为什么字节跳动、腾讯、阿里都在用 Python??
- CSDN|42 张图带你揭秘后端技术都要学啥?
- CSDN|马斯克脑机接口、BrainOS 相继发布,未来已来?