損失函式（八）

損失函式loss function）是用來估量模型的**值f(x)與真實值y的不一致程度，它是乙個非負實值函式,通常使用l(y, f(x))來表示，損失函式越小，模型的魯棒性就越好。損失函式是經驗風險函式的核心部分，也是結構風險函式重要組成部分。模型的結構風險函式包括了經驗風險項和正則項，通常可以表示成如下式子：

損失函式是代價函式的一部分，代價函式是目標函式的一種

回歸常見的損失函式有：均方差（mean squared error，mse）、平均絕對誤差（mean absolute error loss，mae）、huber loss是一種將mse與mae結合起來，取兩者優點的損失函式，也被稱作smooth mean absolute error loss 、分位數損失（quantile loss）損失函式。

分類常見的損失函式有：交叉熵損失（cross entropy loss）、合頁損失（hinge loss）、0/1損失函式、指數損失、對數損失/對數似然損失（log-likelihood loss）

均方差（mean squared error，mse）損失是機器學習、深度學習回歸任務中最常用的一種損失函式，也稱為 l2 loss。其基本形式如下：

可以看到這個實際上就是均方差損失的形式。也就是說在模型輸出與真實值的誤差服從高斯分布的假設下，最小化均方差損失函式與極大似然估計本質上是一致的，因此在這個假設能被滿足的場景中（比如回歸），均方差損失是乙個很好的損失函式選擇；當這個假設沒能被滿足的場景中（比如分類），均方差損失不是乙個好的選擇

平均絕對誤差（mean absolute error loss，mae）是另一類常用的損失函式，也稱為l1 loss。其基本形式如下：

mae與mse的區別：

huber loss是一種將mse與mae結合起來，取兩者優點的損失函式，也被稱作smooth mean absolute error loss 。其原理很簡單，就是在誤差接近0時使用mse，誤差較大時使用mae，公式為：

在分位數回歸quantile regression是一類在實際應用中非常有用的回歸演算法，通常的回歸演算法是擬合目標值的期望（mse）或者中位數（mae），而分位數回歸可以通過給定不同的分位點，擬合目標值的不同分位數。

式中的r為分位數，這個損失函式是乙個分段的函式，當r>0.5時，低估(分別用不同的係數控制高估和低估的損失，進而實現分位數回歸。特別地，當r=0.5時，分位數損失退化為mae損失，從這裡可以看出 mae 損失實際上是分位數損失的乙個特例—中位數回歸

支援向量機support vector machine (svm)模型的損失函式本質上就是hinge loss + l2正則化。

區別：交叉熵函式使用來描述模型**值和真實值的差距大小，越大代表越不相近；似然函式的本質就是衡量在某個引數下，整體的估計和真實的情況一樣的概率，越大代表越相近。

聯絡：交叉熵函式可以由最大似然函式在伯努利分布的條件下推導出來，或者說最小化交叉熵函式的本質就是對數似然函式的最大化。

參考文章

損失函式簡單介紹，簡單說明了常見的損失函式和相關優缺點）

挺詳細的損失函式介紹，並闡明了損失函式背後所依賴的數學原理）

散度詳細原理介紹）

書中損失函式計算）

損失函式（八）

損失函式損失函式 Hinge

常見損失函式損失函式選擇方法

損失函式 SRGAN損失函式（目標函式）詳解

損失函式（八）

損失函式 損失函式 Hinge

常見損失函式 損失函式選擇方法

損失函式 SRGAN損失函式（目標函式）詳解

相關推薦

損失函式損失函式 Hinge

常見損失函式損失函式選擇方法