L1和L2的區別和各自的優勢

2021-07-28 05:43:15 字數 446 閱讀 1527

正則化項可以取不同的形式。例如回歸問題中，損失函式是平方損失，正則化項可以是引數向量的l2範數：

這裡，正則化項也可以是引數向量的l1範數：

這裡l1是絕對值之和，l2是平方之和。

l1追求的是稀疏，可以理解為變數個數少，l2主要用於處理過擬合問題，讓每個權重引數值小？！

l2能加速訓練？！

引：

l0範數是指向量中非0元素的個數。如果我們用l0範數來規則化乙個引數矩陣w，就是希望w的大部分元素都是0這太直觀了，太露骨了吧，換句話說，讓引數w是稀疏的。ok，看到了「稀疏」二字，大家都應該從當下風風火火的「壓縮感知」和「稀疏編碼」中醒悟過來，原來用的漫山遍野的「稀疏」就是通過這玩意來實現的。

L1和L2正則化

l1和l2正則化 l1與l2正則化都是防止模型過擬合，其方式略有不同。具體請見下文。1 l1 正則化l1正則化 1範數是指，各權值變數特徵絕對值之和。其作用是產生權值的稀疏模型，也就是讓大部分權值為0.為什麼能產生權值稀疏模型？因為如下圖所示，各權值絕對值之和後得到乙個矩陣，很容易在矩陣的頂...

關於L1和L2正則

l0範數表示向量中非零元素的個數也就是如果我們使用l0範數，即希望 w的大部分元素都是0 w是稀疏的所以可以用於ml中做稀疏編碼特徵選擇。通過最小化l0範數，來尋找最少最優的稀疏特徵項但不幸的是，l0範數的最優化問題是乙個np hard問題，而且理論上有證明，l1範數是l0範數的最優凸近...

l1和l2正則化

import tensorflow as tf import tensorflow.contrib as contrib weight tf.constant 1.0,2.0 3.0,4.0 with tf.session as sess print sess.run contrib.layers....