CVPR2020|深兰科技挑战复杂场景,获雾天条件目标检测挑战赛冠军
03赛题特点&主要工作
在这次挑战赛中,主要的难点包含以下几个方面:
1.可视条件差、图像模糊
可视条件差是这个赛道核心问题,雾天收集的数据特点就是能见度低,图像模糊,远处的物体不容易被检测与识别,容易造成大量的目标漏检、误检,从而导致mAP效果下降。
2.图片数量少,数据分布不平衡
总共只有4000多张带标注的图片,增加了训练难度,再加上数据分布的不均衡,很难划分一个具有代表性的验证集,很可能导致模型不具有泛化能力,在新的测试集上表现会不如预期。
检测器
我们先通过常规检测所累积的经验构造出一个baseline:
Baseline=Backbone+DCN[1]+FPN[2]+CascadeRCNN[3]
这套pipeline,也是去年冠军团队所使用的方法,在这里我们沿用这套算法,以此为基础进行改进。
通过观察实验结果发现,模型误检情况远多于漏检,经常出现一个目标有多个检测结果,并且这些检测结果之间无法使用nms去除。归纳为两方面原因。
1.模型自身能力不足,回归分类能力差,导致大量误检;
2.负样本不足,由于样本个数限制,模型会在一些模棱两可的地方检测出置信度较高的结果,无法通过阈值去处理这些误检结果。
根据目前结果做了一下几个方面的改进:
1.DoubleHeads[6]
当需要提升模型能力时,有2个比较简单高效的方法,一是使用更强的backbone,二是提高RCNN中分类检测head的能力,通过实验比对,我们最终使用了doublehead的结构(如下图所示)。
▲DoubleHeads
Doublehead采用分而治之的思想,将原始head解耦为2个独立的分支,针对不同的需求设计head结构,通过对比实验可发现:使用FC-head做分类,Conv-head做回归,可以得到最好的效果。
因为分类更多地需要语义信息,所以使用全连接层。而坐标框回归需要更多的空间信息,因此使用卷积层。当然这种方法会增加计算量。在平衡速度和准确率的情况下,最终我们选择了3个残差2个Non-local共5个模块。
最新活动更多
-
11月28日立即报名>>> 2024工程师系列—工业电子技术在线会议
-
12月19日立即报名>> 【线下会议】OFweek 2024(第九届)物联网产业大会
-
即日-12.26火热报名中>> OFweek2024中国智造CIO在线峰会
-
即日-2025.8.1立即下载>> 《2024智能制造产业高端化、智能化、绿色化发展蓝皮书》
-
精彩回顾立即查看>> 2024 智能家居出海论坛
-
精彩回顾立即查看>> 【在线会议】多物理场仿真助跑新能源汽车
推荐专题
-
10 中国AI的“六便士”时刻
发表评论
请输入评论内容...
请输入评论/评论长度6~500个字
暂无评论
暂无评论