人工智能AI届的「最强大脑」能精准区分同种类物体的细微差别


作为人工智能核心能力 , 细粒度图像分类是计算机视觉领域极具挑战的方向 , 而且技术要求越来越高 。 只有让机器「看得」更细更准 , 机器的判断才能有所突破 。 细粒度图像分类针对的是更微观的物体类别 , 比如 , 全世界品种超过几万种的兰花 , AI 不仅要识别出它是一种兰花 , 还要判断具体属于哪一种兰花 , 如果要识别手机 , 要分辨出是什么品牌的哪一种型号 。
再比如生了病的两片树叶 , 同样出现了破损孔洞 , 在传统模型训练下 , AI 最多可以识别出它们都是苹果树的树叶 , 很难确定两个孔洞之间的区别 , 进而给出推断树叶究竟得的是哪两种疾病 。 然而现在支付宝的 AI 模型通过明确识别关键是孔洞大小、数量、位置 , 以及周边是否有斑点 , 最终快速给出树叶由于化学药品滥用造成损伤的判断 。
【人工智能AI届的「最强大脑」能精准区分同种类物体的细微差别】
人工智能AI届的「最强大脑」能精准区分同种类物体的细微差别
本文插图
实际上 , 世界上的约 37 万种植物 , 不同植物的病因完全不同 , 但它们的病态外观和特征却非常相似 。 另一方面 , 采集拍摄中存在姿态、视角、光照、遮挡、背景干扰等影响因素 , 使分类更加具有难度 。
然而这就是近日在计算机视觉 A 类顶级会议 CVPR 2020 开幕在即 , 围绕该方向 Kaggle 共发起六项任务 , 国内互联网公司支付宝参加了其中的患病植物图像分类 。
这个挑战非常难 , 比赛考察 AI 视觉识别技术对苹果树叶子图片进行不同种类的疾病区分能力 , 在训练集 1821 张图像和测试集 1821 张图像中 , 完成高精确度的判别 。
最终 , 在FGVC(Fine-Grained Visual Categorization , 细粒度图像分类)全球挑战赛结果中 , 支付宝天筭 (suàn) 安全实验室在 1316 支参赛队中夺冠 。
人工智能AI届的「最强大脑」能精准区分同种类物体的细微差别
本文插图
*Kaggle 2020-FGVC 挑战赛官方排名
支付宝天筭安全实验室使用的原创模型 , 是基于数据增强、知识蒸馏方法 , 实现在大量信息干扰下进行物体具像化特征识别 , 使细粒度识别精度大幅提升 。 支付宝是比赛中唯一使用知识蒸馏这种深度学习方法的团队 , 在最终测试中 , 支付宝分数达 0.98445 , 排名第一 。 (创见张超编辑报道)


    推荐阅读