池化和空洞卷積 1 卷積神經網路相關

1.1卷積的基本操作與全連線層的區別

區域性連線、權值共享(滑動、權值一致)、輸入輸出資料結構化(保留結構)

1.2感受野大小計算

感受野定義：某層的特徵上的乙個點，cnn的原始輸入上能夠影響這一點取值的範圍的區域。

上一層的感受野加上當前(卷積核的尺寸-1)*前面每層的步長，然後和資料區域大小作比較。

1.3卷積層的輸出尺寸、參數量和計算量

輸出的尺寸=((輸入尺寸+2*padding-kernel_size)/步長)+1

向下取整。

tensorflow、keras不能顯示指定padding_size，可以選擇幾種方式：

padding=same：padding_size=k-1;

padding=valid: 不進行邊界填充

計算量：滑動視窗內卷積操作的計算量c(i)*kw*kh,滑動的次數其實就是輸出的特徵圖的資料個數，也就是c(0)*lw(0)*lh(0)整體計算量為兩個相乘。

1.4分組卷積及其應用場景

group convolution

普通的卷積操作在通道維度上都是全連線的(普通的卷積是每個卷積核都會和輸入的feature的所有通道卷積)，分組卷積就是給輸入通道和輸出通道劃分同樣的組數，然後處於相同組號的輸入通道和輸出通道進行全連線。如果分為g組，那麼最終的參數量和計算量都會變為原來的1/g，舉例，輸入feature為n通道的，kernel=3x3，有n個，那麼最後得到的feature為n channel，那麼普通卷積的參數量3x3xnxn，分兩組的卷積的參數量為(3x3xn/2xn/2)x2變為原來的1/2，計算量也變為原來的1/2，因為分組的話kernel的channel為原來的1/2。

alexnet中使用，解決單gpu無法處理含有較大計算量和儲存需求的卷積層的問題，分組卷積分配到多個gpu上，目前更多用來構建移動裝置的小型網路模型。

1.5轉置卷積的主要思想

transposed convolution

思想就是矩陣的轉置操作，可以看作普通卷積的對稱操作：

(1)能將普通卷積的輸入輸出的尺寸變換逆反過來，不是反卷積

轉置卷積本質上對應的也是乙個普通卷積對應的矩陣乘法

正常的卷積：

轉置卷積：

相當於將輸入的資料進行了乙個補零和上取樣。

轉置卷積主要是對特徵圖進行擴張或者上取樣，語義分割decoder中會用到轉置卷積，輸出和原影象大小一致的圖的時候會用到。

1.6空洞卷積

dilated convolution

一般池化來進行下取樣操作，可以擴大感受野但是會損失資訊，如何不通過池化等下取樣操作來擴大感受野？空洞卷積引入了擴充套件率r，引入之後的卷積核尺寸為k+(r-1)(k-1)的大小。其感受野的計算和普通卷積的計算一致。

1.7變形卷積

deformable convolution

普通卷積束縛了網路的感受野形狀，限制了網路對於幾何形變的適應能力，deformable給卷積核的每乙個取樣點新增乙個可學習的偏移量，deformable引入了乙個平行分支來學習取樣點的位移偏移量，由於偏移量是小數，所以最終的位置需要雙線性插值。

池化和空洞卷積 1 卷積神經網路相關

《1。卷積神經網路》

卷積神經網路學習1 卷積層

卷積神經網路入門 1 卷積型別

池化和空洞卷積 1 卷積神經網路相關

《1。卷積神經網路》

卷積神經網路學習1 卷積層

卷積神經網路入門 1 卷積型別

相關推薦