L1 L2損失和 L1 L2正則化

2021-09-25 07:31:12 字數 405 閱讀 3462

1、l1損失 -- 最小絕對值誤差

最小化（**值 - 真實值）的絕對值，魯棒性強。

2、l2損失 -- 最小平方誤差

最小化（**值 - 真實值）的平方，對於大於1的數，平方更大，因此對樣本敏感。

3、l1正則化

l1正則化和l2正則化可以看做是損失函式的懲罰項，l1正則化是指權值向量中各個元素的絕對值之和。l1正則化可以產生稀疏權值矩陣，稀疏模型就是大部分權重為0的模型，只有小部分特徵對結果有效，有利於特徵選擇。

4、l2正則化（權重衰減）

l2正則化就是在代價函式後面再加上乙個正則化項，原來權重係數為1，現在變為1−ηλ/n < 1，讓係數變小，也就是權重衰減，因此l2正則化可以防止模型過擬合。l2正則化是指權值向量ww中各個元素的平方求和，然後再求平方根。

L1 L2正則化介紹

1 正則化 regularization 對引數w的影響說明 loss 代表原始的代價函式，後面那一項就是l2正則化項，它是這樣來的所有引數w的平方的和，除以訓練集的樣本大小n。就是正則項係數，權衡正則項.在這裡並沒有除以樣本數量和2，是因為使用了絕對值誤差。一般情況下，los s y y 2 ...

L1，L2正則化的區別

1，l1會趨向於產生少量的特徵，而其他不重要的特徵都為0，會產生稀疏性，可以用來選擇特徵，也能一定程度上防止過擬合。而l 2會選擇更多的特徵，特徵值都趨近於0，防止過擬合。lasso在選擇特徵時非常有用，而ridge就只是規則化而已。所以在所有特徵中只有少數特徵起重要作用的情況下，選擇lasso進行...

DataAnalysis 正則化和L1 L2範數

一般而言，監督學習的目標函式是第一項機器學習中損失函式後面經常會跟乙個l1或者l2正則函式，也稱l1 l2範數。0 l0範數指權值向量 1 l1範數指權值向量注由於l0範數很難優化求解 np難問題和l1範數是l0範數的最優凸近似，從而一般只考慮l1而不考慮l2範數。2 l2範數指權值向...