YOLO系列總結

2021-09-24 20:47:22 字數 1887 閱讀 1296

2018 december 04

yolo系列總結

相比 rcnn系列,yolo 系列的主要缺點:

主要原因是每個網格**固定數量的物體使候選框數量減少;

yolo v1

yolo v2—— darknet19

yolo v3—— darknet53

yolo v1—— 無

yolo v2—— 維度拼接,一次,第 16 層 26x26x512 → 13x13x2048 與第 24 層拼接;

yolo v3—— 維度拼接,兩次

yolo v1—— 兩層全連線層;

yolo v2—— 無(大大減少了引數規模);

yolo v3—— 無

yolo v1—— 無

yolo v2—— 無

yolo v3—— 非線性插值法,上採用兩次;

yolo v1—— 無

yolo v2

yolo v3

yolo v1—— grid cell

yolo v2—— anchor box + offset + sigmoid activation

yolo v3—— 同 v2;

yolo v1

yolo v2

yolo v3—— 同 v2;

yolo v1—— 預訓練模型輸入大小為 224x224,檢測模型輸入大小為 448 x 448;

yolo v2—— multi-scale training:每個 10 個 batches 隨機選擇一種解析度輸入(320~608,32的倍數);

yolo v3—— 同 v2;

yolo v1

yolo v2

yolo v3—— 同 v2;

yolo v1—— 也使用了 bn,同時在 fc 中使用 dropout

yolo v2—— 取消 dropout 均使用 bn:提公升模型泛化能力的同時使得模型更容易收斂;

yolo v3—— 同 v2;

yolo v1——

yolo v2—— sgd

yolo v3

yolo v1

yolo v2—— softmax loss

yolo v3—— logistic loss

yolo v1—— 對寬高都進行開根,使得**相同的偏差時更小的框產生更大的損失;

yolo v2—— 使用 $2 - w_*h_$,使小物體的懲罰比大物體重;

yolo v3—— 同 v2;

我的yolo系列總結

探索資料集製作過程中的一些筆記。處理時基本都是利用excel,txt,csv進行,更新中。主要記錄了一些txt的合併,後來發現對於乙個python不是很熟的人,其實結合excel更快 主要記錄了一些如果資料集是按照類別放的話,直接讀取不是很方便,但是將目錄拼起來直接讀取更方便些 主要記錄了一些批量修...

YOLO系列概覽

1.yolo v1 採用乙個24層的卷積網路加2個全連線層。將畫面分成s s個部分,每個部分負責 b個框,每個框有x,y,w,h,confidence 是否有目標,iou為多少 五個 引數。在voc資料集中,有20個類別。演算法中,b 2,即每個分格 2個框。所以,最後的輸出向量維度為s s 30,...

YOLO演算法總結

步驟 1.輸入 608,608,3 2.經過cnn處理,輸出 19,19,5,85 3.展開以上矩陣後為 19,19,425 每個19 19的網格裡有425個數字 425 5 85,每個網格裡有5個achor box,achor box中有85個數字 85 5 80,pc,bx,by,bw,bh,c...