最大似然估計MLE和最大後驗估計MAP理解

1、頻率學派和貝葉斯派

頻率學派認為引數是固定而未知的，關心似然函式。

貝葉斯派認為引數是隨機的有分布的，關心後驗分布。

2、mle、map公式

3、引數估計-mle

4、引數估計-map

map與mle最大的不同在於p(引數)項，map將先驗知識加入，優化損失函式。

5、mle、map、bayesian統一理解

ml（最大似然估計）：給定乙個模型的引數，然後試著最大化p(d|引數)。即給定引數的情況下，看到樣本集的概率。目標是找到使前面概率最大的引數。邏輯回歸都是基於ml做的。mle不把先驗知識加入模型中。

map（最大後驗估計）：最大化p(引數|d)。

bayesian：考慮了所有可能的引數，即所有的引數空間（引數的分布）。

mle和map的目標都是一樣的：找到乙個最優解，然後用最優解做**。貝葉斯模型會給出對引數的乙個分布，比如對模型的引數, 假定引數空間裡有引數1、引數2、引數3、...、引數n，貝葉斯模型學出來的就是這些引數的重要性（也就是分布），然後當我們對新的樣本**的時候，就會讓所有的模型一起去**，但每個模型會有自己的權重（權重就是學出來的分布）。最終的決策由所有的估計根據其權重做出決策。

5、從統計學角度理解機器學習，不無三要素：特徵工程、目標函式、模型學習，機器學習的本質是用計算機統計地估計複雜函式。

定義假設空間（model assumption）：如線性分類，線性回歸，邏輯回歸，svm，深度學習網路等。

定義損失函式（目標函式）並優化求解（如：梯度下降，牛頓法等）。

不同的模型使用不同的演算法，如邏輯回歸通常用梯度下降法解決，神經網路用反向推導解決，貝葉斯模型則用mcmc來解決。

機器學習 = 模型 + 優化（不同演算法）

參考:

最大似然估計MLE和最大後驗估計MAP理解

最大似然估計 MLE 和最大後驗 MAP

最大似然估計 MLE 與最大後驗估計 MAP

最大似然估計（MLE）和最大後驗概率估計（MAP）

最大似然估計MLE和最大後驗估計MAP理解

最大似然估計 MLE 和最大後驗 MAP

最大似然估計 MLE 與最大後驗估計 MAP

最大似然估計（MLE）和最大後驗概率估計（MAP）

相關推薦