多層感知機(MLP)原理簡介

2021-09-12 07:38:13 字數 787 閱讀 7476

多層感知機(mlp,multilayer perceptron)也叫人工神經網路(ann,artificial neural network),除了輸入輸出層,它中間可以有多個隱層,最簡單的mlp只含乙個隱層,即三層的結構,如下圖:

輸入層沒什麼好說,你輸入什麼就是什麼,比如輸入是乙個n維向量,就有n個神經元。

隱藏層的神經元怎麼得來?首先它與輸入層是全連線的,假設輸入層用向量x表示,則隱藏層的輸出就是

f(w1x+b1),w1是權重(也叫連線係數),b1是偏置,函式f 可以是常用的sigmoid函式或者tanh函式:

最後就是輸出層,輸出層與隱藏層是什麼關係?其實隱藏層到輸出層可以看成是乙個多類別的邏輯回歸,也即softmax回歸,所以輸出層的輸出就是softmax(w2x1+b2),x1表示隱藏層的輸出f(w1x+b1)。

mlp整個模型就是這樣子的,上面說的這個三層的mlp用公式總結起來就是,函式g是softmax

因此,mlp所有的引數就是各個層之間的連線權重以及偏置,包括w1、b1、w2、b2。對於乙個具體的問題,怎麼確定這些引數?求解最佳的引數是乙個最優化問題,解決最優化問題,最簡單的就是梯度下降法了(sgd):首先隨機初始化所有引數,然後迭代地訓練,不斷地計算梯度和更新引數,直到滿足某個條件為止(比如誤差足夠小、迭代次數足夠多時)。這個過程涉及到代價函式、規則化(regularization)、學習速率(learning rate)、梯度計算等,本文不詳細討論,讀者可以參考本文頂部給出的兩個鏈結。

多層感知機MLP

關於感知機 1.什麼是感知機 perceptron 感知機是最簡單的神經網路,具備神經網路的必備要素。感知機也稱為感知器,是一種雙層神經網路,即只有輸入層和輸出層而沒有隱層的神經網路。感知機是一種二類分類的線性分類器,其輸入為例項的特徵向量,輸出為例項的類別,感知機屬於判別模型,旨在求出將訓練資料進...

MLP 多層感知機網路

反向傳播神經網路是對非線性可微分函式進行權值訓練的多層網路,是前向神經網路的一種。比如,乙個三層bpn結構如下 由輸入層 隱含層和輸出層三層組成。其中每一層的單元與之相鄰層的所有單元連線,同一層的單元之間沒有連線。當一對學習樣本提供給網路後,神經元的啟用值從輸入層經各中間層向輸出層傳播,在輸出層的各...

keras多層感知機MLP

肯定有人要說什麼多層感知機,不就是幾個隱藏層連線在一起的嗎。話是這麼說,但是我覺得我們首先要自己承認自己高階,不然怎麼去說服 hu nong 別人呢 from keras.models import sequential from keras.layers import dense import n...