深度學習七

2021-09-12 17:12:39 字數 853 閱讀 9169

我看到過的最複雜的模型就是ssd了,應該說在object detection這個領域,大牛們都是一再的奮鬥著、努力著。一路飄過,聽到的模型真的有很多,但是我覺得有質的變化還應該是r-cnn—spp—fast rcnn —faster rcnn— yolo,為什麼會是這樣呢,我感覺其實如果是但一物體的識別就應該是regression的問題,rbg大神也許也這麼想,所以自然多物體的檢測就不是單純的regression,但是我還想讓識別如分類那般,簡單,自然。那怎麼辦呢?就誕生了r-cnn,不再是regression可能的列舉,用了selective search的方法去匹配尋找特徵,提取出classifier,然後再用bbox回歸,使其達到最優。正如作者所言,科學需要不斷地反覆實驗和對比才顯得有價值。spp主要解決了輸入尺寸的問題,更加顯得更有藝術一些;最後fast和faster摒棄了svm分類器的方法,前面還是不夠藝術,說是******,其實是分步做了這些工作,所以fast就出現了,最後大神自己都說速度被限制在了第一步,roi上,於是出現了faster rcnn,最後yolo,直接強制劃分7*7,變成回歸來做,也不需要那些繁瑣的步驟。其實我也有過這種想法,但是不知道怎麼做。

自從看了他們的文章,老師也說地道,不得不說,不僅地道,分析問題一針見血,用詞相當精闢,像我是想不出來的。。。我還記得fast r-cnn裡有這麼一句原話:solutions to these problems often compromise speed,accuracy,or simplicity.當然我比較喜歡compromise。

說了這麼多,其實我就想說,網路的定義,你看看上面這麼多的case,網路都是哪樣的,上次那個rcnn最經典,乙個卷積接著乙個池化,最後再通過全連線層。然後你再看看fast rcnn,faster rcnn和ssd,模型的結構越來越複雜。

深度學習(七)object detection

目標檢測 object detection 的基本思路 檢測 detection 定位 localization 目標檢測在很多場景有用,如無人駕駛和安防系統。特徵提取演算法 如 haar特徵,hog特徵 分類器 如 svm selective search to extract regions c...

深度學習物體檢測(七) SSD

yolo 模型每個網格只 乙個物體,容易造成漏檢 對於物體的尺度相對比較敏感,對於尺度變化較大的物體泛化能力較差。針對 yolo 中的不足,提出的 ssd single shot multibox detector 方法同時兼顧了 map 和實時性的要求。對於輸入影象大小為 300 300 在 vo...

深度學習總結 七 調參經驗

觀察loss勝於觀察準確率,loss設計要合理,對比訓練集和驗證集的loss relu可以很好的防止梯度瀰散問題,當然最後一層的啟用函式千萬慎用relu,如果是分類的用softmax batchnorm可以大大加快訓練速度和模型效能 dropout防止過擬合,可直接設定為0.5,即一半一半,測試的時...