語音識別方法 筆記

2021-08-31 13:52:15 字數 2147 閱讀 7421

語音識別方法

基於引數模型的隱馬爾科夫模型(hmm)的方法和基於非引數模型的向量量化(vq)的方法。

基於人工神經網路(ann)的語音識別方法。

傳統的會與動態時間規劃的演算法(dtw),在連續語音識別中仍然是主流方法。同時,在小詞彙量、孤立字識別系統中,也已有許多改進的dtw演算法被提出。提高系統的識別效能,利用概率尺寸的dtw演算法進行孤立字識別的方法,取得較好的識別效果。

在語音識別中,一般採用k平均最臨近(k-nn)準則來進行決策。因此選擇適當的各種距離測度是問題的關係。往往需要通過實驗多次調整這些門限值才能得到滿意的識別結果。

hmm模型的不足,特徵向量的輸出概率計算以及輸入語音和語音模型的匹配搜尋將占用很大的時間。

語音識別系統的基本資料庫

語音識別系統中包含了大量的控制引數資訊,這些引數以資料庫的形式儲存在計算機中,構成了語音識別系統的基本資料庫。包括詞彙表、語音聲學模型、語音模型引數等。它們是通過「訓練」的方法,從單講話者或多講話者的多次重**音的語音引數以及大量的語法規則中,經過長時間的訓練而聚類得到的。在漢語語音識別尤其是漢語連續語音識別中,必須零這些文字等資訊才能提高識別精度。

單詞詞典和語法

詞典編輯、文字開發和工具

api語音識別原理和識別系統的組成

預處理和引數分析

抗雜訊語音區間的端點檢測

目的:從包含語音的一段訊號中確定語音的起點和終點。有效的端點檢測不僅能使處理時間減到最小,而且能排除無聲段的雜訊干擾,從而使識別系統 具有良好的識別效能。

語音引數分析

目的:抽取語音特徵,以使在語音識別時類內距離盡量減小,類間距離盡量大。特徵引數選擇的好壞直接影響語音識別的精度。

動態時間規整

不能簡單地將輸入引數序列和相應引數模板直接做比較,因為語音頻號具有相當大的隨機性。在進行模板匹配時,這些時間長度的變化會影響測度的估計,從而使識別率降低,因此時間規整處理是必不可少的。

一種簡單的方法是採用對未知語音頻號線性地伸長或縮短直至它與引數模板的長度相一致。然而這種僅僅利用亞擴時間軸的方法不足以實現精確的對正。研究表明,這種簡單方法在大部分識別系統中不能有效地提高識別率。

dtw不斷計算兩向量之間的距離以尋找最優的匹配路徑,所以得到的兩向量匹配時累計距離最小的規整函式,保證了他們之間存在最大的聲學相似特性。

孤立字識別系統

顧名思義是識別孤立發音的字或詞。由於在孤立字(詞)識別中,單詞之間有停頓,可使識別問題簡化;單詞之間的端點檢測比較容易。

識別方法:

採用判別函式或準則的方法。貝葉斯準則,概率統計的方法。

採用dtw的方法,字音的起始點相應於路徑的起始點。最優路徑起點至終點的距離即為待識別語音與模板語音之間的距離。運算量大,但技術上簡單,識別正確率也較高。

再用向量量化的方法。向量量化技術在語音識別的應用方面,尤其是在孤立字語音識別系統中得到了很好的應用。

採用hmm技術的方法。hmm的各狀態輸出概率密度函式即可能用離散概率分布函式表示,也可以用連續概率函式。一般連續隱馬爾科夫模型要比離散隱馬爾科夫模型 計算量大,但識別正確率高。

人工神經網路

採用混合技術的方法。為了彌補單一方法的侷限性,採用把幾種方法組合起來的辦法。

在語音識別中,孤立單詞識別時基礎。詞彙量的擴大、識別精度的提高和計算發咋的的降低是孤立字識別的3個主要目標。關鍵問題是特徵的選擇和提取、失真測度的選擇以及匹配演算法的有效性。向量量化技術則為特徵引數提取和匹配演算法提供了乙個很好的降低運算複雜度的方法。

連線語音識別系統系統的效能評測

1.連續語音識別系統的評測方法以及系統發展性和識別能力的測度

評測比較重使用的標準系統的一般配置是:使用lpcmcc(lpc美爾倒譜係數)或者mfcc特徵引數、bi-gram語音模型以及2段dp匹配法(由基元模型聯結得到最佳單詞序列)等。

系統識別效能的評價測度主要由系統識別率、資訊損失度、使系統的識別率和人的聽取率相當而應附加給系統的雜訊級別大小。

粗略地評估某個系統,可以從兩個方面去考慮:

系統識別任務的難易程度及複雜化性

採用該系統該系統的識別方法對該難度的識別任務的識別效果即識別精確性。

一、評價連續語音識別系統效能的系統識別率等測度

二、評價系統識別任務複雜性的測度

表示在語言模型規定下的系統識別任務複雜性的測度主要由系統靜態分支度和平均輸出度、系統識別任務的熵和識別單位的分支度。

風險識別方法

德爾菲法 優點 1 吸收專家參與 充分利用專家的經驗和學識 2 採用匿名或背靠背的方式,能使每一位專家獨立自由地作出自己的判斷 3 過程幾輪反饋,使專家的意見逐漸趨同。缺點 過程比較複雜,花費時間較長。swot分析方法 是一種根據企業自身的既定內在條件進行分析,找出企業的優勢 劣勢及核心競爭力之所在...

人臉識別方法簡述

基於 子空間變換的方法 基於子空間變換的方法首先對訓練影象進行代數變換,求得乙個由基影象張成的子空間,然後計算每個影象在該子空間中的投影係數,作為影象的特徵。基於機器學習 的方法 基於機器學習的方法包括神經元網路 artificial neural nctwork,ann 方法和支援向量機 s up...

Linq to Entities不識別方法

db.uservalidates.include a a.user where uv u.uservalidates.contains uv,c tolist 執行時出現 linq to entities不識別方法 解決方式可以使用lambda表示式樹 expressionbool express ...