yolov3的缺點 yolov3特點總結

p1，yolov3，簡單總結下比較特別的地方：

1.bounding box **。中心值x,y的**，是通過乙個sigmoid 函式，來**在每乙個單元(cell)的相對位置。而不像普通那種**乙個相對於anchor的offset。然後bbox**損失是用的mse(一般都是用smooth l1)。

3.類別**。沒有使用softmax，而是對每乙個類用二分類(類似邏輯回歸)。作者的解釋是，很多目標是多標籤的。

4.anchor size。首先抽了三次feature map(應該是用fpn架構，沒畫網路結構圖，看著費勁)，每個map都有三種anchor size，這些anchor size 是通過聚類得到的(不再是人為設定scale 和ratio)

5.backbone： darknet-53作者還解釋了下為什麼叫這個名字(it has 53 convolutional layers so we call it.... wait for it..... darknet-53!)(其實就是resnet的bottleneck去掉了1*1公升維部分，直接使用了3*3去公升維)，然後和res101分類效能對比了下，果然resnet又一次地被吊打，準確率、計算效率、速度全盤被吊打。

6.訓練： multi-scale training。

7.效能：小目標檢測很強，大目標一般。ap50的評價指標，賊強，準確率和慢4倍的retinanet差不多。

8.things we tried that didn』t work。(not work的東西也能寫一寫，學到了)

用常用的bbox**，就是**相對anchor的offset，效能下降。直接線性回歸**，不使用sigmoid，效能也下降了。

使用focal loss 下降了兩個點。作者的解釋是將類別的**和邊框置信度的**分開了，不含目標的anchor是不會去計算類別**損失(但是**置信度可是嚴重失衡啊，不懂！求解答)。

像faster-rcnn那樣使用多個iou閾值(大於0.7作為正樣本，小於0.3大於0作為負樣本)，作者這樣做，沒有做出好的結果。

這篇文章也寫得太**不羈了(感覺寫這篇文章的時候，這位老哥已經不打算做cv了)，好多地方的資料就直說直接偷過來的，復現費時間，哈哈哈。

最後還把rebuttal附在了**後面，這篇**應該是沒有發出去。但是依舊這多人在follow，或許這就是大牛吧

yolov3的缺點 yolov3特點總結

yolov3系列零 yolov3詳解

yolov3檢測人頭基於yolo v3的人臉檢測

yolov3損失函式改進 yolov3 損失函式

yolov3的缺點 yolov3特點總結

yolov3系列 零 yolov3詳解

yolov3檢測人頭 基於yolo v3的人臉檢測

yolov3損失函式改進 yolov3 損失函式

相關推薦

yolov3系列零 yolov3詳解

yolov3檢測人頭基於yolo v3的人臉檢測