機器學習正則化

正則化項可以是模型引數向量的範數

首先，範數是指推廣到高維空間中的模，給定向量x=(x1,x2,x3,...,xn)，常用的向量的範數如下：

l0範數：向量非零元素的個數

l1範數：向量各個元素絕對值之和

l2範數：向量各個元素的平方和然後求平方根

lp範數：:向量各個元素絕對值的p次方求和然後求1/p次方

l正則化後會導致引數稀疏，乙個好處是可以簡化模型，避免過擬合。因為乙個模型中真正重要的引數可能並不多，如果考慮所有的引數起作用，那麼可以對訓練資料可以**的很好，但是對測試資料就只能呵呵了。另乙個好處是引數變少可以使整個模型獲得更好的可解釋性。

且引數越小，模型就會越簡單，這是因為越複雜的模型，越是會嘗試對所有的樣本進行擬合，甚至包括一些異常樣本點，這就容易造成在較小的區間裡**值產生較大的波動，這種較大的波動也反映了在這個區間裡的導數很大，而只有較大的引數值才能產生較大的導數。因此複雜的模型，其引數值會比較大