卷積核裡面的引數怎麼來的 1 1卷積核的作用

2021-10-12 08:53:51 字數 2162 閱讀 5792

1x1的卷積核由於大小只有1x1,所以並不需要考慮畫素跟周邊畫素的關係,它主要用於調節通道數,對不同的通道上的畫素點進行線性組合,然後進行非線性化操作,可以完成公升維和降維的功能,如下圖所示,選擇2個1x1大小的卷積核,那麼特徵圖的深度將會從3變成2,如果使用4個1x1的卷積核,特徵圖的深度將會由3變成4。

前面所說的降維,其實也是減少了引數,因為特徵圖少了,引數也自然跟著就減少,相當於在特徵圖的通道數上進行卷積,壓縮特徵圖,二次提取特徵,使得新特徵圖的特徵表達更佳。接著再通過兩個例子來看看它是如何減少引數的。

1、在googlenet的3a模組中,假設輸入特徵圖的大小是28*28*192,1x1卷積通道為64,3x3卷積通道為128,5x5卷積通道為32,如下圖所示:

左邊的卷積核引數計算如下:

192 × (1×1×64) +192 × (3×3×128) + 192 × (5×5×32) = 387072

而右圖的3x3卷積層前加入通道數為96的1x1的卷積,5x5的特徵圖後面加入通道數為16的1x1的卷積,引數的計算如下:

192 × (1×1×64) +(192×1×1×96+ 96 × 3×3×128)+(192×1×1×16+16×5×5×32)= 157184

inception 結構的主要思路是怎樣用密集成分來近似最優的區域性稀疏結構。

上面左圖是作者提出來的基本結構,說明如下:

(1)採用不同大小的卷積核意味著不同大小的感受野,最後拼接意味著不同尺度特徵的融合;

(2)之所以卷積核大小採用1、3和5,主要是為了方便對齊。設定卷積步長stride=1之後,只要分別設定pad=0、1、2,那麼卷積之後便可以得到相同維度的特徵,然後這些特徵就可以直接拼接在一起了;

(3)文章說很多地方都表明pooling挺有效,所以inception裡面也嵌入了。

(4)網路越到後面,特徵越抽象,而且每個特徵所涉及的感受野也更大了,因此隨著層數的增加,3x3和5x5卷積的比例也要增加。

factorizing convolutions with large filter size,也就是分解大的卷積,用小的卷積核替換大的卷積核,因為大尺寸的卷積核可以帶來更大的感受野,但也意味著更多的引數,比如5x5卷積核引數是3x3卷積核的25/9=2.78倍。因此可以用2個連續的3x3卷積層(stride=1)組成的小網路來代替單個的5x5卷積層,(保持感受野範圍的同時又減少了參數量),也就產生了inception v2;而nxn的卷積核又可以通過1xn卷積後接nx1卷積來替代,也就是inception v3結構,但是作者發現在網路的前期使用這種分解效果並不好,還有在中度大小的feature map上使用效果才會更好。(對於mxm大小的feature map,建議m在12到20之間).

如下圖:從左到右是inception v1~incveption v3,需要指出的是將7´7卷積拆成1x7卷積和7x1卷積,比拆成3個3x3卷積更節約引數

2、在resnet模組中,假設輸入的特徵圖的維度是w*h*256,並且最後要輸出的也是256個特徵圖,如下圖所示:

左邊的計算如下:

w*h*256*3*3*256 =589824*w*h

右邊的計算如下:

w*h*256*1*1*64 + w*h*64*3*3*64 +w*h*64*1*1*256 = 69632*w*h

結果相差大概8.5倍。

使用1*1卷積核,實現降維和公升維的操作其實就是channel間資訊的線性組合變化,3*3,64channels的卷積核前面新增乙個1*1,28channels的卷積核,就變成了3*3,28channels的卷積核,原來的64個channels就可以理解為跨通道線性組合變成了28channels,這就是通道間的資訊互動。因為1*1卷積核,可以在保持feature map尺度不變的(即不損失解析度)的前提下大幅增加非線性特性(利用後接的非線性啟用函式),把網路做的很deep,增加非線性特性。

卷積核引數的計算及1 1卷積核

首先,明確乙個概念 卷積並不只是乙個二維的過程,實際上對於輸入的一般而言是三個通道的 r g b 那為什麼輸出的結果可以是128個通道呢?實際上經過卷積過後的通道數是由卷積核的個數來決定的,整個的卷積過程二維情況下也就是在每個通道下發生的卷積過程為 在多通道情況下的卷積情況如下 其實濾波器的維度應該...

1 1卷積核的作用

如何理解跨通道的資訊互動和整合呢?首先還得從三維卷積的計算開始。如圖所示,藍色部分是乙個7 7 n 維數 的feature map,黃色塊為3 3 3的卷積核,將卷積核對應到藍色特徵中可以得到乙個紅色陰影區域,舉個具體的例子 假設卷積核所有的引數都為1。那麼紅色部分的數值 1 1 4 1 3 1 2...

1 1卷積核作用,卷積引數計算,卷積計算量計算

新增截圖了,增加瓶頸層的解釋 聽說是某面試題,一般的卷積運算可以壓縮輸入的長度和寬度,1 1卷積核可以整合各個資料通道資訊縮小資料尺寸的深度,同時減小計算量 卷積核引數計算 卷積核的長度 卷積核的寬度 卷積核的個數 卷積計算量計算 輸出資料大小 卷積核的尺寸 輸入通道數 比如 懶得繪圖 求輸入28 ...