深度學習 卷積神經網路認知

2021-08-26 17:52:57 字數 1541 閱讀 8499

卷積神經網路(cnn)是一種特殊的對影象識別的方式,屬於帶有前向反饋的網路,可用來合理有效的減少神經網路的引數個數。其特點是經過多次特徵提取,關聯型、序列型或結構化等型別的特徵被提取,主要來識別二維圖形。

(1)輸入層:代表一張圖的畫素矩陣;如32×32×3。

特徵提取:

(2)卷積層:深入分析得到抽象程度更高的特徵;經過卷積層的節點矩陣深度會增加。

(3)池化層:不改變三維結構,縮小矩陣的大小;高解析度到低解析度,縮小全連線層節點數,從而減少引數。

分類任務:

(4)全連線層:一般1到2層分類資訊。

(5)softmax層:用於分類問題,得到不同種類的概率分布情況。

(1)三維結構的網路容量(包含:長、寬、高)。

包含三維空間中神經元的卷積神經網路,作為視覺化的乙個層。卷積網路的每一層都將三維輸入轉換為三維輸出值。

分別代表畫素和色彩通道

(2)組成部分

note:①過濾器尺寸只需制定兩個維度,另乙個要人工設定的是深度。

②對影象應用乙個過濾器,將產生乙個對應的特徵圖譜(fm)。

引數計算: ①當使用全0填充        out = [in / stride]

②不使用全0填充        out = [(in - filter +1 ) / stride ]

引數                       (尺寸×輸入深度+1)× 深度

note:最後乙個池化層通常連線到乙個或多個全連線層,全連線層的輸出就是最終的輸出。

(2)基本流程

1°輸入影象,通過和若干過濾器和可加偏置進行卷積,產生相應個fm;

2°fm每組的四個畫素進行求和、加權值和加偏置,通過sigmod函式得到相應特徵對映圖;

3°繼續卷積直到最後乙個子取樣層;

4°將這些畫素處理規則化,並連線成乙個向量輸入到傳統的神經網路,得到輸出。

通過感受區域和權值共享減少了神經網路需要的引數的個數。

(1)子取樣層分組特徵提取

原始資料分組特徵提取,可以減少連線數目,即減少神經網路需要訓練的權值引數的個數。

引數計算:若1000×1000的影象,隱層神經元個數1000×1000,權值引數個數為10^12。

區域性感受域10×10,權值引數個數1000×1000×10×10=10^8。

(2)權值共享

應用小尺寸卷積核對應的引數共享在大尺寸影象上進行卷積,從而在大尺寸影象任意位置獲得乙個此特徵的啟用值。

引數計算:若10×10卷積核則100個權值引數,提取一種特徵;共100個卷積核

權值引數個數:100種卷積核×每種卷積核共享100個引數=10000

note:此方法隱層引數個數和隱層神經元個數無關,只和卷積核的大小、種類有關。

深度學習 卷積神經網路

一 卷積神經網路基礎 二 lenet 三 常見的一些卷積神經網路 卷積層的超引數 填充和步幅。步幅 stride 每次卷積核在輸入陣列上滑動的行數與列數。多輸入與輸出通道 將3維陣列除寬高外的一維稱為通道維。1 1卷積層 包含1 1的卷積核的卷積層。1 1卷積核在不改變輸入高寬的情況下調整通道數。如...

深度學習 卷積神經網路

卷積神經網路 convolutional neural networks,cnn 是一類包含卷積計算且具有深度結構的前饋神經網路 feedforward neural networks 是深度學習 deep learning 的代表演算法之一。卷積神經網路具有表徵學習 representation ...

深度學習之卷積神經網路

卷積神經網路是一種多層神經網路,擅長處理影象特別是大影象的相關機器學習問題。卷積網路通過一系列方法,成功將資料量龐大的影象識別問題不斷降維,最終使其能夠被訓練。cnn最早由yann lecun提出並應用在手寫字型識別上 minst lecun提出的網路稱為lenet,其網路結構如下 這是乙個最典型的...