MFCC特徵引數理解

2021-09-23 20:52:03 字數 536 閱讀 9704

一 mfcc簡介

mfcc,梅爾倒譜係數,是一種語音特徵。

梅爾倒譜係數(mel-scale frequency cepstral coefficients,簡稱mfcc)是在mel標度頻率域提取出來的倒譜引數,mel標度描述了人耳頻率的非線性特性,它與頻率的關係可用下式近似表示:

式中f為頻率,單位為hz。下圖展示了mel頻率與線性頻率的關係:

二、語音特徵引數mfcc提取過程

可用htk來提取mfcc特徵引數,生成的mfcc檔案可以用hlist工具檢視。

附:繁瑣版

MFCC(語音特徵引數)

一 mfcc計算總體流程 1.訊號的預處理,包括預加重 preemphasis 分幀 frame blocking 加窗 windowing 假設語音頻號的取樣頻率fs 8khz.由於語音頻號在10 30ms認為是穩定的,則可設定幀長為80 240點。幀移可以設定為幀長的1 2.2.對每一幀進行ff...

語音特徵引數MFCC

一 mfcc概述 在語音識別 speech recognition 和話者識別 speaker recognition 方面,最常用到的語音特徵就是梅爾倒譜係數 mel scale frequency cepstral coefficients,簡稱mfcc 根據人耳聽覺機理的研究發現,人耳對不同頻...

語音特徵引數MFCC計算過程

語音頻號為從聲道輸入的速度波 輸入訊號 與聲道形狀 系統 卷積得到的聲壓波。語音頻號的特徵引數的提取正是對語音頻號進行時域和頻域的處理分離出聲道形狀 系統 的過程。聲道形狀 系統 也正是無論任何語音頻號,只要每個字母或數字相同 它的發音就相同 它就在一定程度上相同的特徵參量 頻域共振峰 的頂點 的包...