多層感知機（MLP）原理簡介

多層感知機（mlp，multilayer perceptron）也叫人工神經網路（ann，artificial neural network），除了輸入輸出層，它中間可以有多個隱層，最簡單的mlp只含乙個隱層，即三層的結構，如下圖：

輸入層沒什麼好說，你輸入什麼就是什麼，比如輸入是乙個n維向量，就有n個神經元。

隱藏層的神經元怎麼得來？首先它與輸入層是全連線的，假設輸入層用向量x表示，則隱藏層的輸出就是

f(w1x+b1)，w1是權重（也叫連線係數），b1是偏置，函式f 可以是常用的sigmoid函式或者tanh函式：

最後就是輸出層，輸出層與隱藏層是什麼關係？其實隱藏層到輸出層可以看成是乙個多類別的邏輯回歸，也即softmax回歸，所以輸出層的輸出就是softmax(w2x1+b2)，x1表示隱藏層的輸出f(w1x+b1)。

mlp整個模型就是這樣子的，上面說的這個三層的mlp用公式總結起來就是，函式g是softmax

因此，mlp所有的引數就是各個層之間的連線權重以及偏置，包括w1、b1、w2、b2。對於乙個具體的問題，怎麼確定這些引數？求解最佳的引數是乙個最優化問題，解決最優化問題，最簡單的就是梯度下降法了（sgd）：首先隨機初始化所有引數，然後迭代地訓練，不斷地計算梯度和更新引數，直到滿足某個條件為止（比如誤差足夠小、迭代次數足夠多時）。這個過程涉及到代價函式、規則化（regularization）、學習速率（learning rate）、梯度計算等，本文不詳細討論，讀者可以參考本文頂部給出的兩個鏈結。

多層感知機（MLP）原理簡介

多層感知機MLP

MLP 多層感知機網路

keras多層感知機MLP

多層感知機（MLP）原理簡介

多層感知機MLP

MLP 多層感知機網路

keras多層感知機MLP

相關推薦