L0 L1 L2範數的聯絡與區別

這裡簡單地介紹以下幾種向量範數的定義和含義

與閔可夫斯基距離的定義一樣，l-p範數不是乙個範數，而是一組範數，其定義如下：

根據p 的變化，範數也有著不同的變化，乙個經典的有關p範數的變化圖如下：

上圖表示了p從無窮到0變化時，三維空間中到原點的距離（範數）為1的點構成的圖形的變化情況。以常見的l-2範數（p=2）為例，此時的範數也即歐氏距離，空間中到原點的歐氏距離為1的點構成了乙個球面。

實際上，在0時，lp並不滿足三角不等式的性質，也就不是嚴格意義下的範數。以p=0.5，二維座標(1,4)、(4,1)、(1,9)為例，

。因此這裡的l-p範數只是乙個概念上的寬泛說法。

當p=0時，也就是l0範數，由上面可知，l0範數並不是乙個真正的範數，它主要被用來度量向量中非零元素的個數。用上面的l-p定義可以得到的l-0的定義為：

表示向量x中非零元素的個數。

對於l0範數，其優化問題為：

在實際應用中，由於l0範數本身不容易有乙個好的數學表示形式，給出上面問題的形式化表示是乙個很難的問題，故被人認為是乙個np難問題。所以在實際情況中，l0的最優問題會被放寬到l1或l2下的最優化。

l1範數是我們經常見到的一種範數，它的定義如下：

表示向量中

非零元素的絕對值之和。

l1範數有很多的名字，例如我們熟悉的曼哈頓距離、最小絕對誤差等。使用l1範數可以度量兩個向量間的差異，如絕對誤差和（sum of absolute difference）：

對於l1範數，它的優化問題如下：

由於l1範數的天然性質，對l1優化的解是乙個稀疏解，因此l1範數也被叫做稀疏規則運算元。通過l1可以實現特徵的稀疏，去掉一些沒有資訊的特徵，例如在對使用者的電影愛好做分類的時候，使用者有100個特徵，可能只有十幾個特徵是對分類有用的，大部分特徵如身高體重等可能都是無用的，利用l1範數就可以過濾掉。

l2範數是我們最常見最常用的範數了，我們用的最多的度量距離歐氏距離就是一種l2範數，它的定義如下：

表示向量元素的平方和再開平方。

像l1範數一樣，l2也可以度量兩個向量間的差異，如平方差和（sum of squared difference）:

對於l2範數，它的優化問題如下：

l2範數通常會被用來做優化目標函式的正則化項，防止模型為了迎合訓練集而過於複雜造成過擬合的情況，從而提高模型的泛化能力。

當時，也就是範數，它主要被用來度量向量元素的最大值，與l0一樣，通常情況下表示為

來表示

面試L0,L1,L2範數

在深度學習中，監督類學習問題其實就是在規則化引數同時最小化誤差。最小化誤差目的是讓模型擬合訓練資料，而規則化引數的目的是防止模型過分擬合訓練資料。引數太多，會導致模型複雜度上公升，容易過擬合，也就是訓練誤差小，測試誤差大。因此，我們需要保證模型足夠簡單，並在此基礎上訓練誤差小，這樣訓練得到的引數才能...

向量範數矩陣範數（L0, L1, L2）

在數學上，範數包括向量範數和矩陣範數，向量範數表徵向量空間中向量的大小，矩陣範數表徵矩陣引起變化的大小。範數就是距離，計算距離的方法不同，就產生了l0範數 l1範數等等。在向量範數中 l0範數向量中非零元素的數量，嚴格意義上講l0範數並不是範數。l1範數向量各元素絕對值之和，這種方法叫曼哈頓距離...

常用的向量與矩陣的範數總結 L0 L1 L2範數

首先定義乙個向量為 x 5，6，8,10 1 範數 2 範數 p 範數矩陣的1範數矩陣的2範數矩陣的2範數即矩陣ata a a ata的最大特徵值開平方根。矩陣的無窮範數矩陣的每一行上的元素絕對值先求和，再從中取個最大的行和最大 l0範數和l1範數 l0範數是指向量中非零元素的個數。如果...

L0 L1 L2範數的聯絡與區別

面試L0,L1,L2範數

向量範數 矩陣範數（L0, L1, L2）

常用的向量與矩陣的範數總結 L0 L1 L2範數

相關推薦

向量範數矩陣範數（L0, L1, L2）