機器學習中回歸問題的效能衡量指標

2021-10-02 21:19:35 字數 873 閱讀 3745

回歸問題的典型效能指標是均方根誤差(rmse),它測量的是**過程中,**錯誤的標準偏差(標準偏差是方差的算術平方根,而方差是離均平方差的平均數)。

例如,rmse等於50000就意味著,系統的**值中約68%落在50000美元之內,約95%落在100000美元之內(一種常見的特徵分布是呈鐘形態的分布,稱為正態分佈(也叫高斯分布),「68-95-99.7」的規則是指:大約68%的值落在1σ

\sigma

σ,95%落在2σ

\sigma

σ,99.7%落在3σ

\sigma

σ內)。

rmse的數學計算公式為rms

e(x,

h)=1

m∑i=

1m(h

(xi)

−yi)

2rmse(x,h)=\sqrt\sum_^m(h(x^)-y^)^2}

rmse(x

,h)=

m1​i

=1∑m

​(h(

xi)−

yi)2

​即使rmse通常是回歸任務的首選效能衡量指標,但在某些情況下,其它函式可能會更適合。例如,當有很多離群區域時,你可以考慮使用平均絕對誤差(也稱為平均絕對偏差,公式如下所示)mae

(x,h

)=1m

∑i=1

m∣h(

xi)−

yi

∣mae(x,h)=\frac\sum_^m|h(x^)-y^|

mae(x,

h)=m

1​i=

1∑m​

∣h(x

i)−y

i∣均方根誤差和平均絕對誤差兩種方法都是測量兩個向量之間的距離:**向量和目標值向量。距離或者範數的測度可能有多種:

機器學習 回歸問題(一)

首先,我們來看乙個例子。你有乙個朋友,他有一套750平方英呎的房子,他來問你能賣多少錢。然後,你就找來了附近房子的最近買賣資訊,然後把面積跟房價畫了一條曲線出來。注 例子與圖來自andrew ng的machine learning課程。如圖,我們知道的只是上面一些點,橫座標是面積,縱座標是房價。現在...

機器學習 線性回歸問題

案例分析 正規方程 梯度下降 嶺回歸 from sklearn.datasets import load boston from sklearn.linear model import linearregression,sgdregressor,ridge from sklearn.model se...

機器學習線性回歸 機器學習中的簡單線性回歸步驟

簡單線性回歸,這是一種基於自變數值 x 來 因變數值 y 的方法。假設這兩個變數是線性相關的。因此,我們嘗試尋找一種根據特徵或自變數 x 的線性函式來精確 響應值 y 我們將按照之前的資料預處理資訊圖表那樣來執行相同的步驟 其中第三相關庫matplotlib是用來視覺化資料的。匯入資料集 檢查缺失資...