yolov3的缺點 yolov3特點總結

2021-10-13 08:31:21 字數 1123 閱讀 2850

p1,yolov3,簡單總結下比較特別的地方:

1.bounding box **。中心值x,y的**,是通過乙個sigmoid 函式,來**在每乙個單元(cell)的相對位置。而不像普通那種**乙個相對於anchor的offset。然後bbox**損失是用的mse(一般都是用smooth l1)。

3.類別**。 沒有使用softmax,而是對每乙個類用二分類(類似邏輯回歸)。作者的解釋是,很多目標是多標籤的。

4.anchor size。首先抽了三次feature map(應該是用fpn架構,沒畫網路結構圖,看著費勁),每個map都有三種anchor size,這些anchor size 是通過聚類得到的(不再是人為設定scale 和ratio)

5.backbone: darknet-53作者還解釋了下為什麼叫這個名字(it has 53 convolutional layers so we call it.... wait for it..... darknet-53!)(其實就是resnet的bottleneck去掉了1*1公升維部分,直接使用了3*3去公升維),然後和res101分類效能對比了下,果然resnet又一次地被吊打,準確率、計算效率、速度全盤被吊打。

6.訓練: multi-scale training。

7.效能:小目標檢測很強,大目標一般。ap50的評價指標,賊強,準確率和慢4倍的retinanet差不多。

8.things we tried that didn』t work。(not work的東西也能寫一寫,學到了)

用常用的bbox**,就是**相對anchor的offset,效能下降。直接線性回歸**,不使用sigmoid,效能也下降了。

使用focal loss 下降了兩個點。作者的解釋是 將類別的**和邊框置信度的**分開了,不含目標的anchor是不會去計算類別**損失(但是**置信度可是嚴重失衡啊,不懂!求解答)。

像faster-rcnn那樣使用多個iou閾值(大於0.7作為正樣本,小於0.3大於0作為負樣本),作者這樣做,沒有做出好的結果。

這篇文章也寫得太**不羈了(感覺寫這篇文章的時候,這位老哥已經不打算做cv了),好多地方的資料就直說直接偷過來的,復現費時間,哈哈哈。

最後還把rebuttal附在了**後面,這篇**應該是沒有發出去。但是依舊這多人在follow,或許這就是大牛吧

yolov3系列 零 yolov3詳解

目標檢測演算法與efficientdet講解 論 文 翻譯 yolov3主頁 yolo系列的目標檢測演算法可以說是目標檢測史上的巨集篇巨作,v3演算法是在v1 v2基礎上形成的,先看下 yolov1 yolov2 下圖為yolov3的網路結構 dbl darknetconv2d bn leaky 是...

yolov3檢測人頭 基於yolo v3的人臉檢測

一 實驗環境的搭建 1.安裝環境配置 python 3.6 tensorflow gpu 1.6.0 keras pillow opencv python matplotlib numpy 沒有通過pip安裝 例如 pip install keras 2.啟動虛擬環境,並且安裝對應的實驗環境 3.模...

yolov3損失函式改進 yolov3 損失函式

yolov3 損失函式主要分為loss xy,loss wh,loss confidence,loss class loss xy darknet與kreas稍有不同。darknet是sse,kreas是二值交叉熵。一種解釋如下 bounding box回歸是square error loss,分類...