高斯混合模型以及EM演算法

高斯混合模型（gmm），顧名思義，就是資料可以看作是從數個高斯分布中生成出來的。雖然我們可以用不同的分布來隨意地構造 xx mixture model ，但是 gmm是最為流行。另外，mixture model 本身其實也是可以變得任意複雜的，通過增加 model 的個數，我們可以任意地逼近任何連續的概率密分布。

每個 gmm 由 k 個 gaussian 分布組成，每個 gaussian 稱為乙個「component」，這些 component 線性加成在一起就組成了 gmm 的概率密度函式：

$$ p(x) = \sum\limits_^k p(k)p(x|k) = \sum\limits_^k \pi _k\mathcal(x|\mu_k,\sigma_k)\tag $$

假設現在有\n\資料點，我們認為這些資料點由某個gmm模型產生，現在我們要需要確定這些引數。很自然的，我們想到利用最大似然估計來確定這些引數，gmm的似然函式如下：

$$ \log \prod \limits_^np(x_i) = \sum\limits_^n \log p(x_i)=\sum\limits_^n\log\sum\limits_^k \pi _k\mathcal(x_i|\mu_k, \sigma_k)\tag $$

高斯混合模型以及EM演算法

高斯混合模型與EM演算法

EM及高斯混合模型

混合高斯模型（GMM）與EM演算法

高斯混合模型以及EM演算法

高斯混合模型與EM演算法

EM及高斯混合模型

混合高斯模型（GMM）與EM演算法

相關推薦