機器學習正則化項L1範數與L2範數的關係

在學習機器學習過程中，我自己糾結了很久的乙個問題是 l1 norm 和 l2 norm 到底是什麼關係，有什麼區別。

l1 和 l2 都是深度學習中常用的正則化項（regularizer），描述的是模型的複雜度，它的作用在於模型越複雜，正則化項越大，將它加在損失函式（loss function）後面作為罰項（penalty），這樣在最小化損失函式的過程中就可以照顧到模型複雜度的問題，防止過擬合（overfitting）。

關於這兩種範數的公式請自行查詢，下面主要說一下這兩者的關係。

l1正則化會讓你的引數變得更稀疏，也就是使很多引數退化到0，這樣可以起到類似於dropout和特徵選取的功能。另外，l1正則化的公式不可導，這使得反向求偏導數以優化引數時計算過程變得複雜，也使得優化帶有l1正則化項的損失函式更加複雜，方法也五花八門。

l2正則化，則不會讓你的引數退化到0，也就是使你的引數稀疏，因為有平方的存在，當引數很小的時候，這個引數基本就被忽略了，並不會被進一步調整為0。而且l2正則化的公式可導，這使得在優化時計算過程比l1要簡潔。

機器學習正則化項L1範數與L2範數的關係

機器學習 L1與L2正則化項

L1範數與L2範數對比

L1與L2正則化

機器學習 正則化項L1範數與L2範數的關係

機器學習 L1與L2正則化項

L1範數與L2範數對比

L1與L2正則化

相關推薦

機器學習正則化項L1範數與L2範數的關係