ML 李巨集毅機器學習一 error

error反映的是整個模型的準確度，bias反映的是模型在樣本上的輸出與真實值之間的誤差，即模型本身的精準度。variance反映的是模型每一次輸出結果與模型輸出期望值之間的誤差，即模型的穩定性

1.where does the error come from?

error有兩種**，分別是bias和variance，診斷error的**，可以挑選適當的方法improve model。

以進化前的寶可夢為輸入，以進化後的真實cp值為輸出，真實的函式記為f

^\hat

f^。（在上帝視角才能知道f

^\hat

f^）

從訓練資料，我們找到 f∗f^

f∗,f ∗f^

f∗是對f

^\hat

f^的乙個估計。

2.有哪些特性？

簡單模型，variance小。複雜模型，variance大

簡單模型，bias大。複雜模型，bias小

在underfitting的情況下，error大部分來自bias。

在overfitting的情況下，error大部分來自variance。

如果model連訓練樣本都fit得不好，那就是underfitting, bias大

如果model可以fit訓練樣本，但是testing error大，那就是overfitting, variance大

3.解決方法？

what to do with large variance?

4.model selection

不應該這樣做：

因為這樣做，在public testing set上的error rate，並不代表在private testing set上的error rate。

應該這樣做：

將training set分成training set 和 validation set，在training set上訓練model 1-3，選擇在validation set 上error rate最小的model。如果嫌training set中data少的話，可以在確定model後在全部training data上再train一遍該model。

這樣做，在public testing set上的error rate才會代表在private testing set上的error rate。不能用public testing set去調整model。

將training set分成n折，每次只有一折作為validation set，其它折作為training set，在各model中選擇n次訓練得到的n個validation error rate的均值最小的model。

ML 李巨集毅機器學習一 error

李巨集毅機器學習筆記（3） error

李巨集毅機器學習 Introduction

李巨集毅機器學習attack model 學習筆記

ML 李巨集毅機器學習一 error

李巨集毅機器學習筆記（3） error

李巨集毅機器學習 Introduction

李巨集毅機器學習attack model 學習筆記

相關推薦