讀書筆記《數學之美》隱馬爾可夫模型

《數學之美⋅第二版》第五章

1、通訊模型

上圖表示了乙個典型的通訊系統，它包括雅各布森(roman jakobson)提出的通訊的六個要素(傳送者(資訊源)，通道，接收者，資訊，上下文和編碼)。

其中，s1,

s2,s

3,..

. 表示資訊源發出的訊號。o1

,o2,

o3,.

..是接受器接收到的訊號。通訊中的解碼就是根究接收到的訊號o1

,o2,

o3,.

..還原傳送的訊號s1

,s2,

s3,.

..。同樣，很多自然語言處理的應用也可以這樣理解。在從漢語到英語的翻譯中，說話者講的是漢語，但是通道傳播編碼的方式是英語，如果利用計算機，根據接收到的英語資訊，推測說話者的漢語意思，就是機器翻譯。同樣，如果要根據帶有用拼寫錯誤的語句推測說話者想表達的正確意思，那就是自動糾錯。這樣，幾乎所有的自然語言處理問題都可以等價成通訊的編碼問題。

在通訊中，如何根據接收端的觀測訊號o1

,o2,

o3,.

..來推測訊號源傳送的資訊s1

,s2,

s3,.

..呢？只需要從所有的源資訊中找出最可能產生出觀測訊號的那乙個資訊。用概率論的語言來描述，就是在已知o1

,o2,

o3,.

..的情況下，求得令條件概率p(

s1,s

2,s3

,...

|o1,

o2,o

3,..

.)達到最大值的那個資訊串s1

,s2,

s3,.

..，即s1

,s2,

s3,.

..=a

rgal

lmax

s1,s

2,s3

,...

p(s1

,s2,

s3,.

..|o

1,o2

,o3,

...)

(公式1.1)

利用貝葉斯公式，上述公式等價於 p(

o1,o

2,o3

,...

|s1,

s2,s

3,..

.)⋅p

(s1,

s2,s

3,..

.)p(

o1,o

2,o3

,...

) 其中，p(s

1,s2

,s3,

...|

o1,o

2,o3

,...

) 表達資訊s1

,s2,

s3,.

..在傳輸後變成接收的訊號o1

,o2,

o3,.

..的可能性；而p(

s1,s

2,s3

,...

) 表示s1

,s2,

s3,.

..本身是乙個在接收端合乎情理的訊號(比如乙個合乎情理的句子)的可能性；最後，p(

o1,o

2,o3

,...

) 表示在傳送端(比如說話的人)產生資訊o1

,o2,

o3,.

..的可能性。

首先，一旦資訊o1

,o2,

o3,.

..產生了，它就不會變了，這時p(

o1,o

2,o3

,...

) 就是乙個可以忽略常數。因此，上面的公式可以等價於p(

o1,o

2,o3

,...

|s1,

s2,s

3,..

.)⋅p

(s1,

s2,s

3,..

.)當然，這裡有兩項，雖然多過公式1.1的一項，但是這個公式完全可以用隱馬爾可夫模型(hidden markov model)來估計。

2、隱馬爾可夫模型

先複習一下概率論再來寫這一章！

讀書筆記《數學之美》隱馬爾可夫模型

讀書筆記數學之美

隱馬爾可夫模型學習筆記

讀書筆記數學之美筆記

讀書筆記 《數學之美》 隱馬爾可夫模型

讀書筆記 數學之美

隱馬爾可夫模型學習筆記

讀書筆記 數學之美 筆記

相關推薦

讀書筆記《數學之美》隱馬爾可夫模型

讀書筆記數學之美

讀書筆記數學之美筆記