YOLOv4閱讀筆記

2021-10-24 16:11:32 字數 2235 閱讀 2022

**中英對照翻譯參考:

**中首先總結了目標檢測的一般性結構:

通常,傳統的目標檢測器是離線訓練的。因此,研究人員總是喜歡利用這一優勢,開發更好的訓練方法,使目標檢測器在不增加推理成本的情況下獲得更好的精度。我們將這些方法稱為」 bag of freebies」,這些方法僅改變訓練策略或僅增加訓練成本。

資料擴充:

資料擴增的目的是增加輸入影象的可變性,使設計的目標檢測模型對從不同環境獲得的影象具有更高的魯棒性

資料擴充方法是所有畫素調整,並保留調整後區域中的所有原始畫素資訊。

​ 1、光度畸變:調整影象的亮度、對比度、色調、飽和度和雜訊

​ 2、幾何畸變:加入隨機縮放、剪下、翻轉和旋轉

模擬物件遮擋:

隨機擦除 (random erase),cutout:隨機選擇影象中的矩形區域並填充零的隨機或互補值。

hide-and-seek、grid mask:隨機或均勻地選擇影象中的多個矩形區 域,並將其全部替換為0

正則化方法 regularization method:

結合多幅影象進行資料擴充:

mixup:使用兩個影象以不同的係數比率倍增和疊加,然後使用這些疊加比率調整標籤

cutmix:將裁剪的影象覆蓋到其他影象的矩形區域,並根據混合區域的大小調整標籤。

style transfer gan用於資料擴充

語義分布偏差之—解決類別不平衡問題:

label smoothing

將硬標籤轉化為軟標籤進行訓練

bbox:

​ 1、iou_loss

​ 2、giou_loss

​ 3、diou_loss

​ 4、ciou_loss

yolov4 - use:

​ cutmix and mosaic data augmentation、dropblock regularization、 class label smoothing、ciou-loss、cmbn、self-adversarial training、 eliminate grid

對於那些插入模組和後期處理方法只會增加少量的推理成本,但可顯著提高目標檢測的準確性,我們稱其為 「bag of specials」。一般來說,這些插入模組是用來增強某些屬性的,如擴大感受野,引入注意力機制或增強特徵整合能力等,而後處理是一種篩選模型**結果方法。

擴大感受野 enhance receptive field:spp,aspp,rfb

注意力機制 attention module:

特徵融合 feature integration:

啟用函式 activation function:

後處理方法 post-processing method

yolov4 - use:

​ 在ilsvrc2012 (imagenet)資料集上的分類任務,cspresnext50要比cspdarknet53好得多。然而,在coco資料集上的檢測任務,csp+darknet53比cspresnext50更好。

​ backbone:csp+darknet53

​ additional module:spp

​ neck:panet

​ head:yolov3 (anchor based)

​ 為了使檢測器更適合於單gpu上的訓練,做了如下補充設計和改進:

​ 1、引入了一種新的資料增強方法mosaic和自對抗訓練(sat)

​ 2、在應用遺傳演算法的同時選擇最優超引數

​ 3、修改了一些現有的方法,如:sam,pan,cmbn

Yolov4煙火檢測

作者開源的資料集 以上資料集包含煙霧影象,但是標註只有1類 開源模型只有fire類,如果要同時檢測煙霧,需要自己在影象上標註煙霧類別。採用yolov5煙霧 火災2類檢測模型,為自己的資料預標註,然後修正即可!煙火檢測資料集包含的場景型別 大火 小火,建築 草原 森林 車輛 汽車 卡車 電單車 電動車...

YOLOv4學習資源

redmon寫完yolov3,退出計算機視覺領域之後,又有其他大佬推動著這一目標檢測神器的發展。yolov4我沒有看原 而是找了一些部落格資源進行學習,現在把我找到的部落格資源分享在此。看完這些部落格之後,yolov4其實並沒有引入特別創新的idea,作者的目標就是為了設計乙個用於實際工作環境的快速...

yolov4網路結構 目標檢測YOLO V4

一 yolo v4主要做了什麼?通俗的講,就是說這個yolo v4演算法是在原有yolo目標檢測架構的基礎上,採用了近些年cnn領域中最優秀的優化策略,從資料處理 主幹網路 網路訓練 啟用函式 損失函式等各個方面都有著不同程度的優化,雖沒有理論上的創新,但是會受到許許多多的工程師的歡迎,各種優化演算...