深度學習之卷積操作的實現

影象的卷積概述

一般，通過對進行卷積操作，可以對進行某種效果的增強或者是減弱，比如模糊、銳化、浮雕效果等，當然也可以發現中的某些特徵，如查詢物體的邊緣資訊。

什麼是卷積核

一張卷積後的效果，絕大部分取決於它的卷積核。卷積核就是乙個2維的陣列，行列數相等而且為奇數（因為每個卷積核都是對於它中心的那個畫素的作用，只有奇數才能有最中心的那個畫素）。它裡面的元素值代表不同的權值。一般而言，卷積核裡面的所有元素之和為1，當然也可以不等於1.大於1時生成的亮度會增加，小於1時生成的亮度會降低。

那麼，卷積核是怎麼作用在一張圖上的呢？

針對輸入中的單個畫素，將它的值由周圍臨近畫素值加權平均。而這種加權平均的操作產生的新畫素值按照次序可以產生一張新的輸出。

卷積後的尺寸

如果輸入尺寸是m x n, 輸出尺寸是 l x c, 步長用stride表示，卷積核大小為 k, 那麼

一般而言，輸出尺寸都比輸入尺寸要小，為了得到跟輸入尺寸大小相同的，我們可以用padding。

caffe 中的卷積操作原理

滑動視窗在影象中每滑動乙個地方，將影象中該滑動視窗影象展開為一列 (也就是flatten)，所有列組成圖中的滑動視窗矩陣，這裡假設pad=1,stride=1,k=3,則滑動視窗矩陣每行大小為w*h,一共k*k行.

每個核展開為一行，n個核形成的核矩陣大小為n*k*k。

最後將核矩陣和滑動視窗矩陣相乘，每一行就是乙個特徵圖，n個卷積核形成n個特徵圖。

擴充套件到三維

三維和二維性質相同，不過是多了乙個通道的概念。

參考：

深度學習之卷積操作的實現

深度學習之卷積神經網路

深度學習之卷積神經網路

深度學習卷積理解

深度學習之卷積操作的實現

深度學習之卷積神經網路

深度學習之卷積神經網路

深度學習 卷積理解

相關推薦

深度學習卷積理解