關於EM演算法的一些心得感悟

最近因為準備面試，重新看了下em演算法。覺得還是有了新的收穫。大家都知道em演算法是用來解決含有隱含變數的不完全資料問題。一般部落格中舉的最多的例子就是男生女生身高的問題。具體為：假如有一批人，我們已經測得了每個人的身高，這些人中包含男生和女生，問如何分別求解得到男生和女生的身高分布的引數（一般假設都是服從正態分佈）。前人的部落格都說了因為log在求和符號的外面，一般的極大似然法沒法求解這個問題，原因就在於我們並不知道每乙個身高資料到底是男生的還是女生的。而em演算法的提出了一種迭代求解的思路：我們首先假設我們知道每個身高是來自男生分布還是女生分布；然後在已知隱含變數的情況下，即我們已經可以把這批人分成兩半，每一半利用極大似然估計就可以求得均值和方差了；然後把求得的均值和方差再帶回去估計每個樣本是屬於男性還是女性。

em演算法的英文名稱叫做expectation maximization。通常分為兩步，即常說的e步和m步。一般e步的作用是求期望，m步即將e步求得的期望最大化，然後得到新的引數（如混合高斯分布裡的均值和方差）。實際上e步幹的事應該是求得每個隱含變數的後驗分布，即p(

zi|x

i;θ)

，這就是所謂的q函式，基於每個樣本的這個分布我們就可以得到每個樣本的隱含變數值zi

。當我們得到了每個樣本的隱含變數後，就可以把期望公式計算好了，這就是我們常說的計算期望。

關於EM演算法的一些心得感悟

EM演算法的一些感想

EM演算法的一些整理

em演算法的一些理解

關於EM演算法的一些心得感悟

EM演算法的一些感想

EM演算法的一些整理

em演算法的一些理解

相關推薦