資料缺失情況下的引數估計

前言

前一篇講到了引數估計，其中會涉及到特徵維數問題，類別間有差異的特徵有助於分類，而特徵太多又會造成計算和儲存的困難，並且還會造成overfitting導致泛化效能不高。通常會新增正則化或進行特徵降維或進行引數共享/平滑來防止過擬合。本章討論的是在樣本點的某些特徵丟失的情況下如何進行分類的問題。

em（expectation-maximization）演算法

隱馬爾科夫模型(hmm)是關於時序的概率模型，描述由乙個隱藏的馬爾科夫鏈隨機生成不可觀測的狀態隨機序列，再由各個狀態生成乙個觀測而產生隨機序列的過程，隱藏的馬爾科夫鏈隨機生成的狀態的序列，稱為狀態序列；每個狀態生成乙個觀測，而由此產生的觀測的隨機序列，稱為觀測序列，序列的每乙個位置又可以看成是乙個時刻。hmm由初始狀態概率向量

π π

，狀態轉移概率矩陣a和觀測概率矩陣b決定。

π π

和a決定狀態序列，b決定觀測序列。因此，隱馬爾科夫模型

λ λ

可以用三元組來表示：λ=

（a,b

,π） λ=（

a,b,

π）。hmm有三個基本問題：

（1）概率計算問題(估計問題，evaluation)：給定模型λ=

(a,b

,π) λ=(

a,b,

π)和觀測序列o=

(o1,

o2,.

..,on)o

=(o1

,o2,

...,

on),計算在模型

λ λ

下觀測序列o出現的概率p(

o|λ)p(

o|λ)

。（前向演算法和後向演算法）

（2）學習問題：已知觀測序列o=

(o1,

o2,.

..,on)o

=(o1

,o2,

...,

on),估計模型λ=

(a,b

,π) λ=(

a,b,

π)，使得在該模型下觀測序列概率p(

o|λ)p(

o|λ)

最大。（根據訓練資料是包括觀測序列和對應的狀態序列還是只有觀測序列，可以分別由監督學習與非監督學習實現。監督學習方法即使用極大似然估計法來估計hmm的引數，而非監督學習方法即baum-welch演算法，也就是em演算法的前身）。

（3）**問題，也稱為解碼問題：已知模型λ=

(a,b

,π) λ=(

a,b,

π)和觀測序列o=

(o1,

o2,.

..,on)o

=(o1

,o2,

...,

on),求對給定觀測序列條件概率p(i|o)最大的狀態序列i=

(i1,

i2,.

..,it)i

=(i1

,i2,

...,

it)，即給定觀測序列，求最有可能的對應的狀態序列。（維特比演算法求解；對於標註問題，其與條件隨機場(crf)也有密切的關聯，後面的文章會一併提到）。

資料缺失情況下的引數估計

引數估計 CIR模型的引數估計

資料科學引數估計

引數估計狀態估計的基本概念（1）引數估計問題

資料缺失情況下的引數估計

引數估計 CIR模型的引數估計

資料科學 引數估計

引數估計 狀態估計的基本概念（1）引數估計問題

相關推薦

資料科學引數估計

引數估計狀態估計的基本概念（1）引數估計問題