青年|对话顶会、解读最佳:CVPR 2020最佳论文对CV领域的启发( 三 )



青年|对话顶会、解读最佳:CVPR 2020最佳论文对CV领域的启发
本文插图
2)

解决问题的办法
1.Holistic
Holistic代表着完整的、全盘的 。 常见的视觉任务包括分类、物体检测、语义/实例分割、3D重建等 。 人类的视觉系统在面向视觉任务时 , 可以同时全面考虑问题 , 而非像计算机一样需要拆成若干子任务进行处理 。 未来对视觉的研究 , 可模拟人类处理时的方式 , 将各类子任务融合成一个大任务 。
青年|对话顶会、解读最佳:CVPR 2020最佳论文对CV领域的启发
本文插图
2.Cross modality(跨模态学习)

在医学领域 , 医生做病情诊断时 , 除了观察CT、X光等得到医学影像 , 还会借助病人病史、化验结果、问询等了解其他信息 , 这个过程就可以称为跨模态学习 。 为完成一个最终目标 , 可能会需要很多其他模态信号加以辅助 , 视觉任务亦是如此 。 例如将视频里面的声音与图像进行互监督学习 , 常见的有篮球、足球等体育比赛中 , 解说与画面的配合 。 解说语音提供了很多标签 , 利用这些标签可帮助训练视觉模型 。 从大的AI角度来说 , 视觉未来定会和更多其他模态的数据进行融合 。
青年|对话顶会、解读最佳:CVPR 2020最佳论文对CV领域的启发
本文插图
3.X learning

Self-supervised learning、Unsupervised learning、Meta learning、Life-long learning、Robust learning、Transfer learning等机器学习领域的方法 , 都有可能在未来视觉研究领域中发挥巨大的作用 , 催生新的研究方向 。
3)
最终目标
1.Weak supervision
2.Robust
3.Intelligent
对话顶会、解读最佳、碰撞思维、寻求启发 , 感谢黄老师的精彩解读以及独到观点 , 在分享自身见解的同时也启发了大家对于CV领域的思考 。 希望本次分享对大家的CV学习之路有所帮助 , 我们下次分享见!
整理:何文莉
审稿:黄高


推荐阅读