『科技俱乐部菌』大型调优现场,速度和准确率俱佳,YOLOv4来了( 二 )
文章图片
Mosaic是新的数据增强方法 , 同时融合4张训练图片 , CutMix仅融合2张图片 , 使得目标的检测范围超出其正常的上下文 , 另外BN每次统计4张图片 , 这能显著地减少对大mini-batch的需要 。
Self-AdversarialTraining(SAT)也提供新的数据增强手段 , 分为两个前向反向阶段 。 在第一阶段 , 先对图片进行前向计算 , 然后通过反向传播修改图片的像素 , 注意这里不修改网络的权重 , 通过这种方式 , 网络进行了一次对抗式训练 , 制造出没有目标的假象 。 在第二阶段 , 对修改后的图片进行正常的训练 。
文章图片
CmBN是改进版的CBN , 仅统计single-batch中的mini-batch , 如图4所示 , 假设t-3~t为single-batch中的mini-batch , 若干single-batch中包含单个mini-batch , 则CmBN与BN一样 。
文章图片
将SAM从spitial-wiseattention修改为point-wiseattention , 即输入和输出的大小一致 。
文章图片
将PAN的shortcut连接方法 , 从相加改为concate 。
YOLOv4
YOLOv4包含:
Backbone:CSPDarknet53
Neck:SPP , PAN
Head:YOLOv3
YOLOv4使用:
主干网络的BoF(BagofFreebies):CutMix和Mosaic数据增强,DropBlock正则化,标签平滑(Classlabelsmoothing)
主干网络的BoS(BagofSpecials):Mish激活,Cross-stagepartialconnections(CSPNet),Multiinputweightedresidualconnections(MiWRC)
检测端的BoF(BagofFreebies):CIoU-loss,CmBN,DropBlock正则化,Mosaic数据增强,Self-AdversarialTraining,去除边框敏感性(Eliminategridsensitivity , 见实验部分的解释),多anchor回归(之前只选最大的),余弦退火学习率调整(Cosineannealingscheduler),使用遗传算法最优化超参数,随机输入大小
检测端的BoS(BagofSpecials):Mish激活,SPP-block,SAM-block,PAN通道融合,DIoU-NMS
文章图片
实验
InfluenceofdifferentfeaturesonClassifiertraining
文章图片
文章图片
CutMix、Mosaic数据增强和标签平衡(Classlabelsmoothing)比较有效 。
InfluenceofdifferentfeaturesonDetectortraining
文章图片
表4对比的BoF如下:
S:去除边框敏感性 ,, 之前的中心点回归与anchor的边相关 , 当需要趋近或时 , 需要很大的 , 为此对sigmoid添加一个大于1的因子来减少这个影响
M:Mosaic数据增强
IT:IoU阈值 , 使用大于IoU阈值的anchor进行训练 , 之前好像只选最大的
GA:使用遗传算法进行最优超参选择
LS:标签平滑
CNB:论文提出的CmBN
CA:使用余弦退火(Cosineannealingscheduler)进行学习率下降
DM:动态mini-batch大小 , 小分辨率时增加mini-batch
OA:使用最优的anchors
GIoU,CIoU,DIoU,MSE:bbox损失函数
推荐阅读
- 小米科技▲卢伟冰再次发力,全球首发骁龙768G,5G新机将在两天后发布!
- 快科技最贵或达5000元,苹果头戴耳机更多细节曝光:包含两款
- 科技迷7nm版年底流片,要放弃美国代工?国产x86转向三星台积电代工
- 骊微电子科技PD充电器应用方案,PN8161+PN8307H高集成18W
- 快科技小米高管都是外人?雷军透露了一个秘密
- 靓科技解读Thing,a16z、5.15亿美金的数据加密股票基金:找寻下一个Big
- 王伯伯说科技流畅用三年,即将开学的学生党准备好了吗?三款高配低价千元机
- 知叔达科技中芯国际早已料到,成功绕开了光刻机,怒了!荷兰ASML再次失约
- 小熊带你玩科技数据成粤企生产新要素,工业互联网深调研〡从经验依赖到数据驱动
- 每日科技果粉大批华人再掀归国潮,美利坚的钱“不香了”?,硅谷科技人才流失