cs231n筆記9 分割,定位,目標檢測

2021-10-23 11:43:45 字數 1086 閱讀 8750

語義分割是指輸入影象,並對影象中的每個畫素做分類,為每個畫素分配標籤(如下圖牛,樹,草,天空)。語義分割並不區分同類目標。(分不出兩頭牛)

全卷積方法是指,把很多的卷積層堆疊在一起組成乙個網路,每次卷積層都保持影象大小不變, 然後對每個畫素做分類,用網路層一次性完成所有運算。

在多個卷積層之間先進行降取樣,再進行上取樣,使得輸出影象的大小等同輸入影象的大小

降取樣方法有:最大池化(pooling)或跨卷積(strided convolution)。

跨卷積

上取樣方法有: 最近距離去池化, 釘床函式去池化, 轉置卷積

最近距離去池化或者釘床函式

轉置卷積

轉置卷積不做內積,而是取特徵圖的某個輸入值,然後這個值乘以卷積核,以三乘三區域的方式複製這些值作為輸出,用輸入作權重,輸出是帶有權重的卷積核的疊加

輸入是兩個數字,卷積是三個數字,所以輸出的結果就是用卷積核對輸入做加權,最後對輸出中的感受野重疊部分進行疊加,得到6個數字

我們想知道影象中內容的位置

在乙個預訓練的cnn網路上生成影象表示向量。然後用兩個全連線層。

第乙個全連線層用於影象的分類。使用softmax,交叉熵等損失函式來計算分類損失。

第二個全連線層用於輸出位置值(x,y,w,h)。使用l1損失,平滑l1損失l2等損失韓式來計算回歸損失

網路會產生兩個不同的輸入,乙個是類的分數,乙個是邊框座標。

姿態估計

姿態估計是,輸入圖,輸出人的關節/點位。這樣網路就能**出這個人的姿態。使用cnn網路,然後輸出14個關節點的座標值。分別計算14個關節點的回歸損失,這裡使用l2損失。然後對所有損失求和。

cs231n筆記總結

cs231n的課程以及作業都完成的差不多了,後續的課程更多的涉及到卷積神經網路的各個子方向了,比如語義分割 目標檢測 定位 視覺化 遷移學習 模型壓縮等等。assignment3有涉及到這些中的一部分,但需要深入了解的話還是得看 了。所以在看 前把之前已學的知識,筆記和作業 一起做個整理。部落格裡主...

CS231n理解筆記

linear classification notes 該方法的組成 乙個是評分函式 原始影象資料到類別分值的對映 乙個是損失函式 用來量化 分類標籤的得分和真實標籤之間的一致性。影象分類的任務是從已有的固定分類標籤中選擇乙個並分配一張影象,我們介紹了knn分類器,該分類器的基本思想是通過將測試影象...

CS231n課程筆記翻譯

賀完結!cs231n官方筆記授權翻譯總集篇發布 智慧型單元 知乎專欄 cs231n課程筆記翻譯 影象分類筆記 上 智慧型單元 知乎專欄 cs231n課程筆記翻譯 影象分類筆記 下 智慧型單元 知乎專欄 cs231n課程筆記翻譯 線性分類筆記 上 智慧型單元 知乎專欄 cs231n課程筆記翻譯 線性分...