HMM隱馬爾可夫模型

2021-10-25 18:25:20 字數 1297 閱讀 5699

詞性標註演算法有claws,但是計算要計算每一條路徑,所以效率很低,所有有人提出了hmm+維特比演算法(動態規劃思想)記錄區域性最優來計算詞性標註,效率提高,markov model最開始應用在語音識別,如今,在分詞、pos標註和統計機器翻譯都得到廣泛運用。

描述一類重要的隨機過程,這隨機過程是隨時間隨機變化的過程,如系統狀態s1,s2…,sn,隨時間變化轉移至另乙個狀態,這個狀態轉移圖在計算機網路看到過,如tcp狀態轉移圖,不過在markov中更加強調的是時間序列,就是這一時刻和過去時刻。

在顯馬爾可夫模型中前一時刻和現在時刻狀態是可以被觀測的,但有時候有些事件(狀態)是無法被觀測,只能通過可觀測物件推測無法被觀測的物件,舉個例子就是詞性標註,我們可以觀測的物件就是句子切分後的詞串,詞性就是無法觀測的物件,無法從上乙個詞的詞性推測當前詞的詞性,那要如何找出概率最大的詞性標註結果呢?用到的就是hmm模型。

hmm資料由五元組組成分別是

已知模型m(a,b),其中a是轉移矩陣,b是發射概率矩陣,給定乙個模型求觀測序列的概率即p(o

∣m)p(o|m)

p(o∣m)

給定o和模型m,找最優的隱序列q,即arg max⁡q

p(q∣

o,m)

\argmax_q p(q|o,m)

qargma

x​p(

q∣o,

m)依據o以及狀態集合學習最佳的m引數a,b,即arg max⁡m

p(o∣

m)\argmax_m p(o|m)

margma

x​p(

o∣m)

其中詞性標註問題就可以抽象成基本問題2.,這一過程稱為解碼

採用了動態規劃的思想來解決上面提到的基本問題2,vt(j)是所有序列中在t時刻以隱狀態j發射到t時刻觀測狀態終止的最大概率,對應的路徑為區域性最優路徑

v t(

j)=max⁡i

=1nv

t−1(

i)ai

jbjo

tv_t(j) = \max_^n v_(i)a_b_

vt​(j)

=i=1

maxn​v

t−1​

(i)a

ij​b

jot​

​ 最後一時刻求max⁡v

tn(j

)\max v_(j)

maxvtn

​​(j

),反向查詢路徑即為最佳隱序列

隱馬爾可夫模型HMM

隱馬爾科夫模型 hidden markov model,以下簡稱hmm 是比較經典的機器學習模型了,它在語言識別,自然語言處理,模式識別等領域得到廣泛的應用。隱馬爾可夫模型hmm 當然,隨著目前深度學習的崛起,尤其是rnn,lstm等神經網路序列模型的火熱,hmm的地位有所下降。但是作為乙個經典的模...

隱馬爾可夫模型(HMM)

概率圖模型是一類用圖來表達變數相關關係的概率模型。它以圖為表示工具,最常見的是用乙個結點表示乙個或一組隨機變數,結點之間的邊表示變數間的概率相關關係,即 變數關係圖 根據邊的性質不同,概率圖模型可大致分為兩類 第一類是使用有向無環圖表示變數間的依賴關係,稱為有向圖模型或貝葉斯網 第二類是使用無向圖表...

HMM(隱馬爾可夫模型入門)

一 基本概念 一些引數 i是長度為t的狀態序列,o是對應的觀測序列。a是狀態轉移概率矩陣 b是觀測概率矩陣 是初始狀態,其中 i p i 1 qi 綜上,馬爾科夫模型的引數組成 隱馬爾可夫模型的3個問題 最重要 接下來就講解怎麼求概率?怎麼訓練引數?怎麼解碼?上述直接計算方法顯然臺low了。我們可以...