學習理論模型診斷與調參

1、基本概念

2、pac理論

3、vc維

4、極大似然，最大後驗概率，貝葉斯估計

5、模型評估與評價指標

6、模型診斷調參 1、資料集準備

2、特徵工程

3、模型選擇

4、模型評價

在我們開發過程中，我們往往都是摸著石頭過河，我們不知道資料應該是什麼樣子，不知道資料的特徵，資料集多少合適，如何進行特徵工程，選擇什麼樣的模型最合適，最後我們採用什麼指標來評價模型。對於一系列模糊的過程，我們很難確定各個模組該如何處理，如何優化，所以我們需要快速搭建乙個模型，通過結果去分析如何優化問題。

可以說，決定模型最後效能的就是偏差和方差，如果模型在測試集上很好，在訓練集上不好，那麼很有可能是模型方差過大（模型過擬合，前提是訓練集和測試集分布大致一致）。如果模型在訓練集上不好，那麼意味著模型偏差過大（模型欠擬合）。針對這兩種情況，採用控制變數法去調優模型。

一般而言，在模型調優的過程有如下選擇：

1）更多的資料集

2）特徵工程

3）模型引數調優

4）優化演算法調優

5）換模型，換優化演算法

6）資料集分析

如何定位出模型的問題，就需要分析模型在訓練集和測試集上誤差來大致確定是偏差問題還是方差問題。

偏差問題：

1）優化演算法：是否收斂，學習率是否合適，迭代次數是否合適，是否需要換優化演算法

2）模型：模型引數選擇是否合適，模型的表示能力是否更強，是否需要換模型

3）特徵工程：特徵選擇和特徵提取是否做的不夠

方差問題：

1）測試集和訓練集分布是否一致

2）模型是否加強正則項，調優模型防止過擬合的引數

3）優化演算法是否可以提前收斂

4）特徵工程

5）增加訓練資料集

其中最難是不同的模型有不同的調優方式，尤其是引數多的模型，一般採用控制變數的方法固定其他不變來調整其中乙個來調優。對於不同的模型，還有特殊的處理技巧，比如深度學習，各種超參，技術都會影響效能。另外，特徵工程是乙個覺得模型效能上限的技術，要想得到乙個很好的模型，後期大量時間花費在特徵工程上。

學習理論模型診斷與調參

機器學習理論 GMM模型

機器學習模型調參

超速學習理論與方法實踐

學習理論 模型診斷與調參

機器學習理論 GMM模型

機器學習 模型調參

超速學習理論與方法實踐

相關推薦

學習理論模型診斷與調參

機器學習模型調參