yolov3系列零 yolov3詳解

目標檢測演算法與efficientdet講解

論文翻譯

yolov3主頁：

yolo系列的目標檢測演算法可以說是目標檢測史上的巨集篇巨作，v3演算法是在v1、v2基礎上形成的，先看下 yolov1、yolov2

下圖為yolov3的網路結構

dbl(darknetconv2d_bn_leaky)：是 yolov3 的基本元件。就是卷積 + bn + leaky relu

res_unit：dbl + dbl add

resn：n 代表數字有 res1、res2…res8 等等，表示這個 res_block 裡含有多少個 res_unit。參考 resnet

concat：張量拼接。將 darknet 中間層和後面的某一層進行拼接。拼接的操作和殘差層 add 是不一樣，拼接會擴張張量的維度，而 add 只是直接相加，不會導致張量維度的改變

yolov3使用了 darknet53 前面的52層，yolov3這個網路是乙個全卷積網路大量使用殘差的跳層連線，並且為了降低池化帶來的梯度負面效果，作者直接屏棄了 pooling ,用 conv 的 stride 來實現降取樣。在這個網路結構中使用的是步長為2的卷積來降取樣為了加強演算法對小目標檢測的精確度，yolov3中採用類似 fpn 的 upsample 和融合做法（最後融合了3個scale其他兩個scale的大小分別是 26*26、52*52），在多個 scale 的 feature map 上做檢測作者在3條**支路採用的也是全卷積的結構，其中最後乙個卷積層的卷積核個數是255，是針對coco資料集的80類：3*(80+4+1)=255，3表示乙個grid cell包含3個bunding box，4表示框的4個座標資訊，1表示objectness score.

``所謂多尺寸就是來自這三條**之路，y1、y2、y3的深度都是255邊長的規律是13:26:52。yolov3設定的是每個網路單元**3個box，所以每個box需要有（x,y,w,h,confidence）五個基本引數，然後還要有80個類別的概率。所以3*(80+4+1)=255

v1、v2、v3是如何來的

–未完待續

參考

一文看懂yolo v3

yolo系列之yolo v3【深度解析】

yolov3系列零 yolov3詳解

yolov3的缺點 yolov3特點總結

yolov3檢測人頭基於yolo v3的人臉檢測

yolov3損失函式改進 yolov3 損失函式

yolov3系列 零 yolov3詳解

yolov3的缺點 yolov3特點總結

yolov3檢測人頭 基於yolo v3的人臉檢測

yolov3損失函式改進 yolov3 損失函式

相關推薦

yolov3系列零 yolov3詳解

yolov3檢測人頭基於yolo v3的人臉檢測