『科技俱乐部菌』大型调优现场,速度和准确率俱佳,YOLOv4来了( 二 )


『科技俱乐部菌』大型调优现场,速度和准确率俱佳,YOLOv4来了
文章图片
Mosaic是新的数据增强方法 , 同时融合4张训练图片 , CutMix仅融合2张图片 , 使得目标的检测范围超出其正常的上下文 , 另外BN每次统计4张图片 , 这能显著地减少对大mini-batch的需要 。
Self-AdversarialTraining(SAT)也提供新的数据增强手段 , 分为两个前向反向阶段 。 在第一阶段 , 先对图片进行前向计算 , 然后通过反向传播修改图片的像素 , 注意这里不修改网络的权重 , 通过这种方式 , 网络进行了一次对抗式训练 , 制造出没有目标的假象 。 在第二阶段 , 对修改后的图片进行正常的训练 。
『科技俱乐部菌』大型调优现场,速度和准确率俱佳,YOLOv4来了
文章图片
CmBN是改进版的CBN , 仅统计single-batch中的mini-batch , 如图4所示 , 假设t-3~t为single-batch中的mini-batch , 若干single-batch中包含单个mini-batch , 则CmBN与BN一样 。
『科技俱乐部菌』大型调优现场,速度和准确率俱佳,YOLOv4来了
文章图片
将SAM从spitial-wiseattention修改为point-wiseattention , 即输入和输出的大小一致 。
『科技俱乐部菌』大型调优现场,速度和准确率俱佳,YOLOv4来了
文章图片
将PAN的shortcut连接方法 , 从相加改为concate 。
YOLOv4
YOLOv4包含:
Backbone:CSPDarknet53
Neck:SPP , PAN
Head:YOLOv3
YOLOv4使用:
主干网络的BoF(BagofFreebies):CutMix和Mosaic数据增强,DropBlock正则化,标签平滑(Classlabelsmoothing)
主干网络的BoS(BagofSpecials):Mish激活,Cross-stagepartialconnections(CSPNet),Multiinputweightedresidualconnections(MiWRC)
检测端的BoF(BagofFreebies):CIoU-loss,CmBN,DropBlock正则化,Mosaic数据增强,Self-AdversarialTraining,去除边框敏感性(Eliminategridsensitivity , 见实验部分的解释),多anchor回归(之前只选最大的),余弦退火学习率调整(Cosineannealingscheduler),使用遗传算法最优化超参数,随机输入大小
检测端的BoS(BagofSpecials):Mish激活,SPP-block,SAM-block,PAN通道融合,DIoU-NMS
『科技俱乐部菌』大型调优现场,速度和准确率俱佳,YOLOv4来了
文章图片
实验
InfluenceofdifferentfeaturesonClassifiertraining
『科技俱乐部菌』大型调优现场,速度和准确率俱佳,YOLOv4来了
文章图片
『科技俱乐部菌』大型调优现场,速度和准确率俱佳,YOLOv4来了
文章图片
CutMix、Mosaic数据增强和标签平衡(Classlabelsmoothing)比较有效 。
InfluenceofdifferentfeaturesonDetectortraining
『科技俱乐部菌』大型调优现场,速度和准确率俱佳,YOLOv4来了
文章图片
表4对比的BoF如下:
S:去除边框敏感性 ,, 之前的中心点回归与anchor的边相关 , 当需要趋近或时 , 需要很大的 , 为此对sigmoid添加一个大于1的因子来减少这个影响
M:Mosaic数据增强
IT:IoU阈值 , 使用大于IoU阈值的anchor进行训练 , 之前好像只选最大的
GA:使用遗传算法进行最优超参选择
LS:标签平滑
CNB:论文提出的CmBN
CA:使用余弦退火(Cosineannealingscheduler)进行学习率下降
DM:动态mini-batch大小 , 小分辨率时增加mini-batch
OA:使用最优的anchors
GIoU,CIoU,DIoU,MSE:bbox损失函数
『科技俱乐部菌』大型调优现场,速度和准确率俱佳,YOLOv4来了


推荐阅读