本文共 944 字,大约阅读时间需要 3 分钟。
CVPR2017提出了针对Yolov1的改进版本Yolov2,并且基于Yolov2,作者又提出了Yolo9000
yolo9000就是针对yolov2进行了简单的调整,使得网络能够实现实时监测超过9000种物体类别
Yolov2的改进
- 引入了anchor box的思想
- 输出层:卷积层替代YOLOV1的全连接层
- 联合使用coco和imagenet物体分类标注数据
- 识别种类、精度、速度、和定位准确性等都有大大提升
具体来说
①Batch Normalization
- v1中也大量用了BN,同时在定位层dropout
- v2中取消了dropout,均使用BN
②高分辨率分类器
- v1中使用224×224预训练,448×448用于检测网络
- V2以448×448的分辨率微调最初的分类网络
③Anchor Boxes
- 预测bbox的偏移,使用卷积代替FC
- 输入尺度:416
- max pooling下采样
- 预测超过1000个
- mAP降低,recal显著提高
④细粒度特征
添加pass through layer,把浅层特征图(26x26)连接到深层特征图
- Resnet中的identity mapping
- 把26×26×512的特征图叠加成13×13×2048的特征图,与深层特征图相连接,增加细粒度特征
- 性能获得了1%的提升
⑤Multi-Scale Training
每隔几次迭代后就会微调网络的输入尺寸
- 输入图像尺寸{320,352,…,608}
- 尺度的变化
Yolov2网络结构
Yolov1中作者主要采用了GoogLeNet作为中干网络
而在Yolov2中,作者重新设计了一种新的分类网络Darknet
Darknet-19
- 主要使用3×3卷积
- pooling之后channe数加
- global average pooling
- 1×1卷积压缩特征表示
- batch normalization
每个box包含4个坐标值,1个置信度和classes个条件类别概率
Yolo9000
YOLO9000是在YOLOv2的基础上提出的一种可以检测超过9000个类别的模型,其主要贡献点在于提出了一种分类和检测的联合训练策略
采用了wordtree这样一种结构,来联合检测数据集和分类数据集中的数据
转载地址:http://ioygf.baihongyu.com/