落叶知秋|华为云EI问鼎国际图像识别领域“世界杯”


落叶知秋|华为云EI问鼎国际图像识别领域“世界杯”
文章图片
再接再厉!在第四届图像识别竞赛WebVision中华为云EI以82.97%的准确率 , 击败来自全世界的94支参赛队伍 , 夺得桂冠!
落叶知秋|华为云EI问鼎国际图像识别领域“世界杯”
文章图片
WebVision竞赛由苏黎世联邦理工(ETH)、GoogleResearch、卡耐基梅隆大学(CMU)等共同组织 , 是目前图像识别领域最权威的竞赛之一 , 被业界誉为人工智能“世界杯” , 接棒曾经推动计算机物体分类准确率超过人类的ImageNet竞赛 。
竞赛中 , 参赛选手通过AI模型将1600万+张图片精准分类到5000个类目中 , 其所用数据集直接从互联网爬取 , 没有经过人工标注 , 因此数据中含有很多噪音 , 且数据类别的数量存在着极大不平衡 。
此项竞赛相较于ImageNet , WebVision难度提高许多 , 同时也更加贴近于实际应用中的场景 。
WebVision竞赛展示了另外一种可能性:基于弱监督学习 , 深度学习可以不再以人工标注数据为基础 , 人工智能有望真正摆脱“人工” 。
落叶知秋|华为云EI问鼎国际图像识别领域“世界杯”
文章图片
此次竞赛中 , 华为云EI基于ModelArts训练大规模图像分类模型 , 基于先进的分布式训练方法 , 可以缩短超大规模数据集的训练时间 。
华为云利用伴随图像数据的文本描述信息 , 融合文本与视觉多模态特征 , 通过训练过程中的动态评估 , 识别并剔除大量噪声数据;通过知识蒸馏进一步降低噪声对模型训练的影响;从互联网上自动爬取大规模数据集进行学习 , 最终在完全没有人工标注的情况下 , 训练得到准确率82.97%高精度模型 。
落叶知秋|华为云EI问鼎国际图像识别领域“世界杯”
文章图片
【落叶知秋|华为云EI问鼎国际图像识别领域“世界杯”】华为云EI在本次比赛中运用的图像识别技术 , 可广泛用于通用物品识别、图像/视频标签等领域 。
近十年来计算机视觉取得的进展离不开大量人工标注的数据集 , 但由于人工标注需要较高的成本 , 几乎不太可能构建包罗万象的超级数据集 。
互联网上存在几乎取之不尽的无标注图像数据 , 利用这些数据的周边文本等信息作为带噪声的弱标注数据进行学习 , 能够在很大程度上降低图像识别对人工标注的依赖 。
华为云EI在视觉研究领域有着丰富的技术积累 , 在6月14日-19日举办的CVPR2020(国际计算机视觉和模式识别大会)中 , 华为贡献论文34篇 , 涵盖迁移学习、半监督学习、网络架构搜索、模型算子优化、知识蒸馏、对抗样本生成等前沿领域 。
2019年 , 基于华为云图像识别能力 , 在上海天文台与国际组织SKA(平方公里阵列射电望远镜)合作的项目中 , 科学家们仅用10.02秒即完成了对20万颗星体的识别 , 同时可以准确地对某一类星体进行定位 , 而传统方式完成如此大量的星体识别工作需要169天时间 。
目前 , 华为云EI内容审核、人脸识别、图像搜索、视频分析等服务已经成功应用于互联网、媒资、园区、物流、工业等行业 。
关注@华为云 , 获取更多精彩资讯


    推荐阅读