卷積與卷積神經網路

神經網路中的卷積是指用乙個卷積核（也叫濾波器），實質上是乙個矩陣，在影象上掃瞄一遍，得到乙個新的影象。掃瞄的實質，就是矩陣大小的影象畫素值，和卷積核做運算，然後得到新的畫素值，放到新的影象中

運算不是一行乘一列的乘法，而是哈達馬積，即對應位置的元素一一相乘。最後，把哈達馬積得到的矩陣上的每乙個元素求和，得到最終的畫素值。因此，每個神經元輸入為影象的一小塊和卷積核，輸出為乙個數值

選擇合適的卷積核，可以突出影象的關鍵資訊。例如，這個卷積核說明每個畫素會在原有值上增加八倍，在減去相鄰的一圈的畫素點。因為背景顏色相近，以綠色為主，所以處理後得到的影象基本為黑色。而鹿和背景交界處相差較大，所以為白色曲線

卷積神經網路經常用於影象處理。在其他神經網路中，輸入往往是向量，權值也是向量。而卷積神經網路中，輸入是乙個巨大的矩陣，每個神經元負責大矩陣上的一小塊，即影象的灰度矩陣，權值是卷積核，輸出是一系列數值拼起來的小矩陣

如圖，區域性感知即只關注新影象這個位置附近的畫素點。這樣可以有效的提取影象特徵而且不會讓計算量過大。

卷積核會掃瞄整個影象，做卷積運算，得到新的影象。

掃瞄時，卷積核一般每次只移動一格，即步長為1。

例如，假設影象大小為4*4，卷積核大小為2*2，那麼卷積運算不是4次，而是3*3=9次，因為每行移動兩次，計算三次，總共有三行

當然，也可以選擇其他步長。例如上面的例子如果選擇2，那麼就是2*3=6次，因為行還是三行，但每一行只需要計算兩次。

在處理影象時，可以選擇多個卷積核，生成不同的影象。這些不同影象可以理解為不同通道

卷積是令影象的每一小塊與卷積核做哈達馬積然後求結果矩陣的每個元素之和。而池化就是對影象的每一小塊做其他處理，這些處理可以是取最大，取平均。

處理方式依然是用滑動視窗掃瞄一遍，只不過這次不需要其他矩陣配合了。

優點：可以對影象降維，克服過擬合，在影象識別領域，池化還能提供平移和旋轉不變性。

經過多次卷積或池化處理後，影象可以獲知到影象的低階資訊，然後通過低階資訊，不斷拼接處高階資訊，最後得到最終結果。就像盲人摸象，先通過底層特徵，得到這是腿，這是象鼻，這是尾巴等，再通過判斷這些特徵的大小，位置等判斷出這是大象的概率相對最高。

在卷積神經網路中，降取樣層一般就是池化操作。