強化學習神經網路學習 MNIST手寫字符集識別

現在僅僅停留在看懂**以及卷積神經網路的學習過程，這是新手菜鳥學習筆記，主要參考的是，matlab**過程（一次寫不完慢慢更新）

識別的手寫字符集為mnist字符集，我們首先需要將所有的手寫字符集提取。提取過程中需要注意的是，手寫字符集的前16位元組為其控制資訊，分別為4位元組的幻數，4位元組的影象數，4位元組的行數以及4個位元組的列數。讀取手寫字符集時，先讀取其不同的控制號

magic = fread(fp, 1, 'int32', 0, 'ieee-be'); %讀幻數
numimages = fread(fp, 1, 'int32', 0, 'ieee-be'); %讀影象數
numrows = fread(fp, 1, 'int32', 0, 'ieee-be'); %讀行號
numcols = fread(fp, 1, 'int32', 0, 'ieee-be'); %讀列號

讀取完控制號可以進行後續的影象向量的讀取（列向量形式）並將讀取結果首先儲存為三維向量的形式（影象數x行x列，10000x28x28)，而後通過壓縮將其壓縮成為二維向量影象數x行列，100000x784)，儲存後其行號代表影象號，列號即為影象資料，可通過reshape函式還原成為2828的形式。

同理，對於手寫字符集的標籤的讀取與上述相同，標籤只包含4個控制位元組，並且可以直接儲存為乙個單獨向量，與影象讀入的格式相同

在影象處理中，gabor函式是乙個用於邊緣提取的線性濾波器。gabor濾波器的頻率和方向表達同人類視覺系統類似。在空間域中，乙個二維gabor濾波器是乙個由正弦平面波調製的高斯核函式。對於影象gabor濾波，首先設定濾波器的數量，在影象處理中濾波器的數量需要根據影象的特徵得到。為了得到影象不同的濾波特點，需要對gabor濾波器設定不同的方向並且設定不同的濾波尺度。濾波方向就是gabor濾波公式中的θ角度設定（**中採用了16個濾波角度），濾波尺度就是用來當作卷積核的濾波器的尺寸大小（**中採用了11個濾波尺寸，分別為7，9，11，13，15…27,小於影象尺寸的28），並且確定在gabor濾波中所需要的波長，頻寬，相位偏移（**中動態改變，增加濾波器多樣性）。濾波器尺度就是當前矩陣大小，對於其尺度中的每乙個元素，均以下標帶入公式計算：

y= exp( -(  (x*cos(theta)+y*sin(theta))^2  +  gamma^2*(-x*sin(theta)+y*cos(theta))^2  ) / (2*sigma^2) )...
*cos( (2*pi/lambda) * (x*cos(theta)+y*sin(theta)) );

對於每乙個濾波器完成計算後，按照矩陣的形式儲存在cell資料結構中，行號表示該濾波器尺寸，列號表示該濾波器對應的角度

將構造的濾波器作為卷積核與每一張影象進行卷積，由於影象按照一維向量壓縮儲存，用reshape函式將影象還原成矩陣形式，使用conv2函式對影象按照不同的卷積核進行卷積，conv2函式卷積過程如下

將卷積核旋轉180°，用旋轉後的卷積核函式中心對準每乙個影象數字，進行卷積操作（缺失資料的進行補0），並根據輸入第三引數判斷返回矩陣的規格。

上述卷積操作在卷積層中發生（l1層），並在卷積完成後返回乙個四維特徵向量l1[特徵行號，特徵列號，濾波器尺寸，濾波器方向]，即為卷積後的平面影象特徵。

池化層減少卷積層的特徵引數的維度和數量，採用最大池化，即縮小卷積層的特徵數量（**中以8為步長進行縮減），而後將每個影象的四維特徵矩陣壓縮成一維向量按序儲存

更新中~

強化學習神經網路學習 MNIST手寫字符集識別

神經網路優化學習率

神經網路優化學習率

強化學習強化學習基礎

強化學習神經網路學習 MNIST手寫字符集識別

神經網路優化 學習率

神經網路優化 學習率

強化學習 強化學習基礎

相關推薦

神經網路優化學習率

神經網路優化學習率

強化學習強化學習基礎