博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
YOLO算法(二)—— Yolov2 & yolo9000
阅读量:2135 次
发布时间:2019-04-30

本文共 944 字,大约阅读时间需要 3 分钟。

CVPR2017提出了针对Yolov1的改进版本Yolov2,并且基于Yolov2,作者又提出了Yolo9000

yolo9000就是针对yolov2进行了简单的调整,使得网络能够实现实时监测超过9000种物体类别

 

Yolov2的改进

  • 引入了anchor box的思想
  • 输出层:卷积层替代YOLOV1的全连接层
  • 联合使用coco和imagenet物体分类标注数据
  • 识别种类、精度、速度、和定位准确性等都有大大提升

具体来说

①Batch Normalization

  • v1中也大量用了BN,同时在定位层dropout
  • v2中取消了dropout,均使用BN

②高分辨率分类器

  • v1中使用224×224预训练,448×448用于检测网络
  • V2以448×448的分辨率微调最初的分类网络

③Anchor Boxes

  • 预测bbox的偏移,使用卷积代替FC
  • 输入尺度:416
  • max pooling下采样
  • 预测超过1000个
  • mAP降低,recal显著提高

④细粒度特征

添加pass through layer,把浅层特征图(26x26)连接到深层特征图

  • Resnet中的identity mapping
  • 把26×26×512的特征图叠加成13×13×2048的特征图,与深层特征图相连接,增加细粒度特征
  • 性能获得了1%的提升

⑤Multi-Scale Training

每隔几次迭代后就会微调网络的输入尺寸

  • 输入图像尺寸{320,352,…,608}
  • 尺度的变化

 

Yolov2网络结构

Yolov1中作者主要采用了GoogLeNet作为中干网络

而在Yolov2中,作者重新设计了一种新的分类网络Darknet

Darknet-19

  • 主要使用3×3卷积
  • pooling之后channe数加
  • global average pooling
  • 1×1卷积压缩特征表示
  • batch normalization

 

每个box包含4个坐标值,1个置信度和classes个条件类别概率

 

 

Yolo9000

      YOLO9000是在YOLOv2的基础上提出的一种可以检测超过9000个类别的模型,其主要贡献点在于提出了一种分类和检测的联合训练策略

     采用了wordtree这样一种结构,来联合检测数据集和分类数据集中的数据

 

 

 

转载地址:http://ioygf.baihongyu.com/

你可能感兴趣的文章
【JS】【31】读取json文件
查看>>
OpenSSL源代码学习[转]
查看>>
Spring下载地址
查看>>
google app api相关(商用)
查看>>
linux放音乐cd
查看>>
GridView+存储过程实现'真分页'
查看>>
flask_migrate
查看>>
解决activemq多消费者并发处理
查看>>
UDP连接和TCP连接的异同
查看>>
hibernate 时间段查询
查看>>
java操作cookie 实现两周内自动登录
查看>>
Tomcat 7优化前及优化后的性能对比
查看>>
Java Guava中的函数式编程讲解
查看>>
Eclipse Memory Analyzer 使用技巧
查看>>
tomcat连接超时
查看>>
谈谈编程思想
查看>>
iOS MapKit导航及地理转码辅助类
查看>>
检测iOS的网络可用性并打开网络设置
查看>>
简单封装FMDB操作sqlite的模板
查看>>
iOS开发中Instruments的用法
查看>>