學習筆記TF011 多層神經網路

線性回歸、對數機率回歸模型，本質上是單個神經元。計算輸入特徵加權和。偏置視為每個樣本輸入特徵為1權重，計算特徵線性組合。啟用(傳遞)函式計算輸出。線性回歸，恒等式(值不變)。對數機率回歸，sigmoid。輸入->權重->求和->傳遞->輸出。softmax分類含c個神經元，每個神經元對應乙個輸出類別。

xor異或運算，無法通過線性模型解決。sigmoido型別神經元要求資料線性可分。2d資料存在直線，高維資料存在超平面，把不同類別樣本分隔。

在神經網路輸入和輸出之間插入更多神經元，解決非線性可分問題。輸入層->隱含層(hidden layer)->輸出層->輸出。隱含層使網路可以對輸入資料提出更多問題。隱含層每個神經元對應乙個問題，依據問題回答最終決定輸出結果。隱含層在資料分布圖允許神經網路繪製以一條以上分隔線。每條分隔線向輸入資料劃分提出問題，所有相等輸出劃分到單個區域。深度學習，新增更多隱含層，可採用不同型別連線，使用不同啟用函式。

梯度下降法，找到函式極值點。學習，改進模型引數，大量訓練，損失最小化。梯度下降法尋找損失函式極值點。梯度輸出偏導數向量，每個分量對應函式對輸入向量相應分量偏導。求偏導，當前變數外所有變數視為常數，用單變數求導法則。偏導數度量函式輸出相對特定輸入變數的變化率，當輸入變數值變化，輸出值的變化。損失函式輸入變數指模型權值，不是實際資料集輸入特徵。相對於推斷模型每個權值。

梯度輸出向量表明每個位置損失函式增長最快方向，在函式每個位置向哪個方向移動函式值可增長。點表示權值當前值。梯度向右箭頭表示為增加損失需向右移動，簡頭長度表示向右移動函式值增長量。反方向移動，損失函式值減少。直到梯度模為0,達到損失函式極小值點。

學習速率(learning rate)縮放梯度。梯度向量長度在損失函式單元中，縮放與權值相加。學習速率是超引數(hyperparameter)，模型手工可配置設定，需指定正確值。太小，需要多輪迭代。太大，超調(overshooting)，永遠找不到極小值點。用tf.summary.scalar函式在tensorboard檢視損失函式值變化曲線。

區域性極值點問題，通過權值隨機初始化，增加靠近全域性最優點附近開始下降機會。損失函式所有極值點接近等價。

tf.gradients方法，符號計算推導指定流圖步驟梯度以張量輸出。梯度下降法取決輸入資料形狀及問題特點。

誤差反向傳播演算法，計算損失函式相對網路權值偏導，每層導數都是後一層導數與前一層導輸出積。前饋，從輸入開始，逐一計算隱含層輸出，直到輸出層。計算導數，從輸出層逐一反向傳播。復用所有已完成計算元素。

sigmoid隱含層，softmax輸出層以及帶反向傳播梯度下降，是最基礎構件。

學習筆記TF011 多層神經網路

神經網路簡介多層神經網路

人工神經網路多層神經網路

Pytorch學習筆記五多層神經網路

學習筆記TF011 多層神經網路

神經網路簡介 多層神經網路

人工神經網路 多層神經網路

Pytorch學習筆記 五 多層神經網路

相關推薦

神經網路簡介多層神經網路

人工神經網路多層神經網路

Pytorch學習筆記五多層神經網路