語音頻號處理第十章

2021-10-07 22:35:15 字數 2040 閱讀 3366

語音頻號處理第二章

語音頻號處理第三章

語音頻號處理第四章

語音頻號處理第五章

語音頻號處理第七章

語音頻號處理第九章

語音頻號處理第十章

語音頻號處理第十二章

具體的說話人確認系統

基於gmm

說話人識別系統框圖

說話人識別是乙個二值問題,只需判定是否為申請者所講。

端點檢測、預加重、加窗、分幀

語音短時能量

基音週期、語音短時譜、共振峰頻率及其頻寬

倒譜、mfcc

線性**係數lpc、lpc倒譜

f=不同說話人特徵引數均值的方差÷同一說話人特徵引數方差的均值

f越大,表示特徵引數越有效。

建立和應用說話人識別系統分為兩個階段:

(1)訓練階段

(2)識別階段

博主ps:這個跟孤立詞識別系統的兩個階段可以說是一模一樣了

(1)概率統計

(2)基於最近鄰原則的dtw:將識別模板和參考模板進行時間對比,按照某種距離測度得出兩模板間的相似程度

(3)向量量化vq:以量化產生的失真度作為判決標準。

(4)hmm:對於與文字無關的說話人識別一般採用各態歷經型hmm,對於與文字有關的說話人識別一般採用從左到右hmm。hmm不需要時間規整。

對於要求快速處理的說話人識別系統,可以採用多門限判決和預分類技術來達到加快系統響應時間而又不降低確認率的效果。

門限設定由誤拒絕率和誤接收率來決定,一般選擇誤拒絕率和誤接收率的相等點附近。

識別特徵:bpfg

匹配方法:dtw

特點

(1)在結構上基本沿用語音識別的系統

(2)利用過程中的資料來修正原模板(正確確認時,使用此時的輸入特徵對原模板進行加權修改)

匹配方法:hmm+vq

失真測度:歐氏距離

步驟

訓練:特徵提取——建立hmm模型

識別:端點檢測——特徵提取——前後向演算法計算概率——與閾值進行比較判斷

型別:從左到右型hmm

特點:所需訓練資料少,提取的特徵較穩定

型別:各態歷經型hmm。一般使用狀態數為5,各狀態採用混合高斯密度分布,混合分布數一般取64個分布

特點:識別效果取決於狀態數和狀態的混合分布數之乘積

步驟

訓練:利用多數說話人的訓練資料訓練得到的模型作為初始模型——由各說話人的訓練資料對初始模型進行自適應訓練,得到各說話人的模型

由於訓練資料少,為了得到高精度的模型,有兩類訓練方法可以使用:

方法一:利用說話人的所有發音資料建立乙個和基元類別無關的說話人hmm,然後以此為初始模型,根據各說話人的訓練語音文字內容,利用連線學習法,僅對各高斯分布的權值進行再推定,而均值和方差不變。

方法二:利用非特定人基元hmm和各說話人hmm進行組合。

混合高斯分布模型gmm是只有乙個狀態的模型,狀態裡具有多個高斯分布函式。

第十章 異常處理

異常即是乙個事件,該事件會在程式執行過程中發生,影響了程式的正常執行。一般情況下,在python無法正常處理程式時就會發生乙個異常。異常是python物件,表示乙個錯誤。當python指令碼發生異常時我們需要捕獲處理它,否則程式會終止執行。捕捉異常可以使用try except語句。try excep...

第十章 異常處理下

try finally 語句無論是否發生異常都將執行最後的 以下例題中 finally 語句無論異常是否發生都會執行 例題 try runoob except assertionerror as error print error else try with open file.log as fil...

第十章 函式

使用def關鍵字 定義個數可變的位置形參 定義個數可變的關鍵字形參 定義預設值引數 定義個數可變的位置形參 deffun1 args 結果為乙個元組 print args fun1 10,20,30 10,20,30 定義個數可變的關鍵字形參 deffun2 args 結果為乙個字典 print a...