深度學習 1x1卷積核的作用

問：發現很多網路使用了1x1卷積核，這能起到什麼作用呢？另外我一直覺得，1x1卷積核就是對輸入的乙個比例縮放，因為1x1卷積核只有乙個引數，這個核在輸入上滑動，就相當於給輸入資料乘以乙個係數。不知道我理解的是否正確

答2：

我來說說我的理解，我認為1×1的卷積大概有兩個方面的作用吧：

1. 實現跨通道的互動和資訊整合

2. 進行卷積核通道數的降維和公升維

下面詳細解釋一下：

1. 這一點孫琳鈞童鞋講的很清楚。1×1的卷積層（可能）引起人們的重視是在nin的結構中，**中林敏師兄的想法是利用mlp代替傳統的線性卷積核，從而提高網路的表達能力。文中同時利用了跨通道pooling的角度解釋，認為文中提出的mlp其實等價於在傳統卷積核後面接cccp層，從而實現多個feature map的線性組合，實現跨通道的資訊整合。而cccp層是等價於1×1卷積的，因此細看nin的caffe實現，就是在每個傳統卷積層後面接了兩個cccp層（其實就是接了兩個1×1的卷積層）。

2. 進行降維和公升維引起人們重視的（可能）是在googlenet裡。對於每乙個inception模組（如下圖），原始模組是左圖，右圖中是加入了1×1卷積進行降維的。雖然左圖的卷積核都比較小，但是當輸入和輸出的通道數很大時，乘起來也會使得卷積核引數變的很大，而右圖加入1×1卷積後可以降低輸入的通道數，卷積核引數、運算複雜度也就跟著降下來了。以googlenet的3a模組為例，輸入的feature map是28×28×192，3a模組中1×1卷積通道為64，3×3卷積通道為128,5×5卷積通道為32，如果是左圖結構，那麼卷積核引數為1×1×192×64+3×3×192×128+5×5×192×32，而右圖對3×3和5×5卷積層前分別加入了通道數為96和16的1×1卷積層，這樣卷積核引數就變成了1×1×192×64+（1×1×192×96+3×3×96×128）+（1×1×192×16+5×5×16×32），引數大約減少到原來的三分之一。同時在並行pooling層後面加入1×1卷積層後也可以降低輸出的feature map數量，左圖pooling後feature map是不變的，再加卷積層得到的feature map，會使輸出的feature map擴大到416，如果每個模組都這樣，網路的輸出會越來越大。而右圖在pooling後面加了通道為32的1×1卷積，使得輸出的feature map數降到了256。googlenet利用1×1的卷積降維後，得到了更為緊湊的網路結構，雖然總共有22層，但是引數數量卻只是8層的alexnet的十二分之一（當然也有很大一部分原因是去掉了全連線層）。

深度學習 1x1卷積核的作用

1X1卷積核作用

深度學習 1x1卷積核

1x1卷積核的作用

相關推薦