「reid」腾讯优图再次刷新三大ReID公开数据集纪录,首位命中率最高近99%
近日 , 腾讯优图实验室在行人重识别(ReID)技术上再次取得突破 , 通过引入跨场景ReID , 其ReID模型性能刷新了三大权威主流ReID公开数据集CUHK03 , DUKE-MTMC和Market1501的记录 , 算法关键指标首位命中率(RANK1 Accuracy)和平均精度均值(Mean Average Precision)获得业内最好成绩 。表1: ReID公开数据集性能比较
图片
数据来源于网络行人重识别(Person ReID)是指对不同摄像机捕捉到的行人图像建立身份对应关系(即关联行人ID) , 对行人实现在整个场景下的行动路线的全面刻画 。 简单来说 , 在看不到人脸的复杂多场景下也能通过体态等对人进行识别 。 相较于人脸识别技术 , ReID对人体图像的遮挡、朝向和清晰度具有较高的鲁棒性 , 对摄像头的清晰度、架设位置、角度没有硬性要求 。 正因此ReID技术成为继人脸识别技术后计算机视觉领域又一热门课题 。
鉴于ReID技术的技术优势和在各个领域的广泛应用前景 , 近年来 , 腾讯优图在这一方向上做出了大量技术投入和全面的技术布局 , 在CVPR、TPAMI、AAAI、IJCAI等国际顶级学术会议和期刊上发表了超过15篇相关领域学术论文 。
图片
图一:行人ReID示意图虽然ReID技术已经过多年的演进 , 但现实中复杂多变的场景 , 也让跨场景识别(cross-domain person re-identification)成为ReID技术的一大难题 , 此次腾讯优图刷新三大数据集所引入的跨场景ReID , 便是在此难点上进行了技术突破 。
跨场景识别的难点在于 , 不同场景由于环境光照、摄像头角度、背景等因素 , 例如室内大型商场、小型门店的侧面和高俯角相机、室外道路、社区的强光和夜晚环境等 , 都会对人体图像的视觉特征造成影响 。 如何让ReID技术适应复杂多变的场景 , 实现跨场景行人图像的检索 , 是一项重大的技术挑战 , 也是实现室内外行人动线联动、全城联动的关键性技术 。 突破此技术难点对拓展ReID的落地场景和业态 , 实现大规模行人识别有巨大的作用 。
图片
图二:公开数据集MSMT17中的室内外行人图像视觉差异为解决ReID技术难点 , 腾讯优图通过在遮挡匹配、全角度匹配、跨域检索等业务问题上的针对性优化 , 以及在模型结构、损失函数、训练算法等各项技术上的大量积累和创新 , 提出了一种跨场景行人重识别技术框架 , 采用基于图卷积和孪生网络的模型 , 使得神经网络对多朝向、多姿态等跨场景的人体具有更强的识别能力 。 这一技术能够为不同场景、不同拍摄角度和光照条件的行人视觉特征学习统一的特征表达 , 有效提升了ReID技术在行人图像室内外、跨场景的相互检索的精度 。
图片
图三:跨场景行人重识别通过引入跨场景ReID , 腾讯优图在三个数据集中刷新业内最好的水平 , 其中Market-1501数据集的RANK1达到98.99% 。 RANK1和MAP作为衡量ReID技术水平的核心指标 , 首位命中率高 , 就意味着算法能够在众多图像中准确找出最容易识别或匹配的那张 。
在此基础上 , 腾讯优图的ReID算法在多场景行人图像相互检索也处于业界领先水平 , 在跨场景ReID数据集MSMT-17上超越已有算法达到业内顶尖水平 。
【「reid」腾讯优图再次刷新三大ReID公开数据集纪录 , 首位命中率最高近99% 】表2:跨场景行人重识别性能比较
图片
腾讯优图的ReID技术不仅在相关数据集上已经取得了领先的性能 , 依托ReID技术的应用系统也已在多种场景达到商用水平并实现广泛落地 。 未来 , 随着跨场景行人重识别能力的逐步成熟 , 腾讯优图的ReID技术也将在更多的场景和业态实现价值 。(责任编辑:李显杰 )
推荐阅读
- 腾讯新闻深网|小米引入新高管,任命杨柘出任中国区CMO
- 区块腾讯安全领御TUSI区块链落地五大场景,助力可信城市建设
- |你的微信被监听了?腾讯微信团队辟谣:绝不会做
- 金融投资报社|网易云音乐王者归来,腾讯音乐危机重重,音乐平台“二战”在即?
- 国货腾讯携手吴晓波推出中国首部大型品牌经济纪录片《新国货》
- 腾讯科技|vivo发布X50系列手机:微云台结构量产 三机型3498元起售
- 腾讯科技|一文读懂网易招股书亮点:发售价不高于126港元 研发人员超1万名
- 腾讯大学|《科技向善》出版,马化腾序言再谈使命愿景
- 腾讯科技|社交游戏公司Zynga同意斥资18亿美元收购移动游戏公司Peak
- 3DMGAME|腾讯公布AI“艾灵”:拥有近乎真人声线 还会唱歌跳舞