過擬合解決方案

方法一：儘量減少選取變數的數量

具體而言，我們可以人工檢查每一項變數，並以此來確定哪些變數更為重要，然後，保留那些更為重要的特徵變數。至於，哪些變數應該捨棄，我們以後在討論，這會涉及到模型選擇演算法，這種演算法是可以自動選擇採用哪些特徵變數，自動捨棄不需要的變數。這類做法非常有效，但是其缺點是當你捨棄一部分特徵變數時，你也捨棄了問題中的一些資訊。例如，也許所有的特徵變數對於**房價都是有用的，我們實際上並不想捨棄一些資訊或者說捨棄這些特徵變數。

方法二：正則化

正則化中我們將保留所有的特徵變數，但是會減小特徵變數的數量級（引數數值的大小θ(j)）。

這個方法非常有效，當我們有很多特徵變數時，其中每乙個變數都能對**產生一點影響。正如我們在房價**的例子中看到的那樣，我們可以有很多特徵變數，其中每乙個變數都是有用的，因此我們不希望把它們刪掉，這就導致了正則化概念的發生。

接下來我們會討論怎樣應用正則化和什麼叫做正則化均值，然後將開始討論怎樣使用正則化來使學習演算法正常工作，並避免過擬合。

過擬合解決方案

過擬合（原因解決方案原理）

過擬合問題和解決方案

過擬合解決方案之正則化

過擬合解決方案

過擬合（原因 解決方案 原理）

過擬合問題和解決方案

過擬合解決方案之正則化

相關推薦

過擬合（原因解決方案原理）