語音識別 HMM

2021-07-27 06:52:00 字數 1311 閱讀 5626

1. hmm 的基本組成要素

乙個hmm模型可以用5個元素來描述,包過2個狀態集合和3個概率矩陣。其分別為

隱含狀態q

可觀測狀態o

初始狀態概率矩陣π

隱含狀態概率轉移矩陣a

觀測狀態轉移概率矩陣/發射概率b

引入幾個符號:

at(i) : 表示到第 t 個觀察值 o

t時處於 狀態 i 。

2. hmm 的三個基本問題

1) computing likelihood (計算似然)

給定乙個 hmm 觀察序列 o,和模型引數

λ=(a, b,

π),計算似然 p(o|λ)。

怎樣有效計算這一觀測序列出現的概率

2) decoding (解碼)

給定乙個 hmm 觀察序列o,和模型引數

λ=(a, b

,π),找到最優的隱藏序列q,

怎樣尋找滿足這種觀察序列意義上最優的隱含狀態序列 q

3) learning (學習)

給定乙個hmm 觀察序列o,和 hmm 中的乙個狀態集合,學習 hmm 的 引數 a 、b、π

即hmm的模型引數λ=(a,b,π)未知,如何求出這3個引數以使觀測序列o=o1o

2o3…o

t的概率盡可能的大。

3. computing likelihood: the forward alogrithm (前向演算法

4. decoding: the viterbi alogrithm (維特比演算法)

5. training hmms: the forward-backward alogrithm (前向後向演算法)

C 語音識別(文字to語音 語音to文字)

最近打算研究一下語音識別,但是發現網上很少有c 的完整 就把自己的學習心得放上來,和大家分享一下。1 speechsdk51.exe 67.0 mb 2 speechsdk51langpack.exe 81.0 mb 文字to語音 這個相當的簡單。1 在com選項卡裡面的microsoft spee...

C 語音識別(文字to語音 語音to文字)

最近打算研究一下語音識別,但是發現網上很少有c 的完整 就把自己的學習心得放上來,和大家分享一下。1 speechsdk51.exe 67.0 mb 2 speechsdk51langpack.exe 81.0 mb 文字to語音 這個相當的簡單。1 在com選項卡裡面的microsoft spee...

語音識別技術

中科院聲學所將為奧運會提供語音技術支援 日前,由首信集團 首都資訊發展股份 牽頭 中科院聲學所參與其核心模組研製的 奧運會多語言服務 系統被北京奧組委正式採用。這標誌著聲學所在利用自身科研優勢 積極為 科技奧運 做貢獻方面取得了新的成果。從2002年開始,聲學所就參與了由科技部和北京市科委組織,北京...