吳恩達deep learning筆記 week1

我們從下圖可以得到一些答案

如圖，橫軸是資料量的大小，軸承是模型的表現

我們可以看到，傳統的機器學習模型在資料量較小時，隨著資料量的增加，效能會快速得到提公升，但是當資料量超過一定量時，再提公升幾乎對效果不再有任何提公升。

而神經網路模型，隨著資料量的繼續加大，當傳統機器學習模型失效時，它的效果仍然在不斷提公升，而且模型越複雜，可接受的資料量越大。

這從資料規模和模型複雜度兩個角度解釋了為什麼深度學習模型要優於傳統機器學習模型。我想還有另外乙個原因，就是神經網路能夠自己抽取特徵，只要我們放進input data它會自動抽取輸入的特徵，儘管這些特徵我們人類還無法很好的理解。

另外想記錄的一點是，啟用函式，我們知道sigmoid函式的函式形態，會導致input的絕對值很大時，它的梯度很小接近於0，也就是梯度消失，導致訓練非常慢。有位大神提出了新的啟用函式relu 它的數學表示式max

(0,x

)max(0,x)

max(0,

x)即input小於0的部分為0，大於0的部分為斜線，由於它有半部分梯度永遠為1，所以訓練的速度非常快。