PP-YOLO超越YOLOv4-目标检测的进步 PP-YOLO评估指标比现有最先进的对象检

文章插图
PP-YOLO评估指标比现有最先进的对象检测模型YOLOv4表现出更好的性能。然而，百度的作者写道：
本文不打算介绍一种新型的目标检测器。它更像是一个食谱，告诉你如何逐步建立一个更好的探测器。
让我们一起看看。
YOLO发展史YOLO最初是由Joseph Redmon编写的，用于检测目标。目标检测是一种计算机视觉技术，它通过在目标周围画一个边界框来定位和标记对象，并确定一个给定的框所属的类标签。和大型NLP transformers不同， YOLO设计得很小，可为设备上的部署提供实时推理速度。
YOLO-9000是Joseph Redmon出版的第二个“YOLOv2”目标探测器，它改进了探测器，并强调了该检测器能够推广到世界上任何物体的能力。
文章插图
YOLOv3对检测网络做了进一步的改进，并开始将目标检测过程纳入主流。我们开始发布关于如何在PyTorch中训练YOLOv3、如何在Keras中训练YOLOv3的教程，并将YOLOv3的性能与EfficientDet（另一种最先进的检测器）进行比较。
然后约瑟夫·雷德曼出于伦理考虑退出了目标探测游戏。
当然，开源社区接过了指挥棒，继续推动YOLO技术的发展。
YOLOv4最近由Alexey AB在他的YOLO Darknet存储库中发表。 YOLOv4主要是其他已知的计算机视觉技术的集合，通过研究过程进行了组合和验证。请看这里深入了解YOLOv4 。

YOLOv4论文的读数与PP-YOLO论文相似，如下所示。我们提供了一些关于如何在Darknet中训练YOLOv4的很好的训练教程。

然后，就在几个月前， YOLOv5被发布了。 YOLOv5采用了Darknet（基于C）的训练环境，并将网络转换为Pytorch 。改进的训练技术进一步提高了模型的性能，并创建了一个非常好用的开箱即用的对象检测模型。从那以后，我们一直鼓励使用Roboflow的开发人员通过这个YOLOv5训练教程将他们的注意力转向YOLOv5 ，以形成他们的自定义对象检测器。
输入PP-YOLO 。
PP代表什么？PP是百度编写的深度学习框架PaddlePaddle的缩写。

文章插图
如果你不熟悉Paddle ，那我们就在同一条船上了。 paddle最初是用Python编写的，它看起来类似于PyTorch和TensorFlow 。深入研究paddle框架很有趣，但超出了本文的范围。
PP-YOLO贡献PP-YOLO的论文读起来很像YOLOv4论文，因为它是计算机视觉中已知的技术的汇总。新颖的贡献是证明这些技术的集成可提高性能，并提供消融研究，以研究每一步对模型的帮助程度。
在我们深入研究PP-YOLO的贡献之前，先回顾一下YOLO检测器的体系结构。
解剖YOLO检测器

文章插图
YOLO检测器分为三个主要部分。
YOLO Backbone：YOLO Backbone（骨干）是一个卷积神经网络，它将图像像素合并在一起以形成不同粒度的特征。骨干通常在分类数据集（通常为ImageNet）上进行预训练。
YOLO Neck：YOLO Neck（上面选择了FPN）在传递到预测头之前对ConvNet图层表示进行组合和混合。
YOLO Head：这是网络中进行边界框和类预测的部分。它由关于类，框和对象的三个YOLO损失函数指导。
现在，让我们深入了解PP YOLO做出的贡献。