語音識別 漢明窗

2021-09-24 02:37:00 字數 991 閱讀 6615

首先,hamming()函式的作用是返回乙個l點的對稱海明窗列向量w。

語音頻號一般在10ms到30ms之間,我們可以把它看成是平穩的。為了處理語音頻號,我們要對語音頻號進行加窗,也就是一次僅處理窗中的資料。因為實際的語音頻號是很長的,我們不能也不必對非常長的資料進行一次性處理。明智的解決辦法就是每次取一段資料,進行分析,然後再取下一段資料,再進行分析。

怎麼僅取一段資料呢?

一種方式就是構造乙個函式。這個函式在某一區間有非零值,而在其餘區間皆為0。漢明窗就是這樣的一種函式。它主要部分的形狀像sin(x)在0到pi區間的形狀,而其餘部分都是0。這樣的函式乘上其他任何乙個函式f,f只有一部分有非零值。

為什麼漢明窗這樣取呢?

因為之後我們會對漢明窗中的資料進行fft(快速傅利葉變化),它假設乙個窗內的訊號是代表乙個週期的訊號。(也就是說窗的左端和右端應該大致能連在一起)而通常一小段音訊資料沒有明顯的週期性,加上漢明窗後,資料形狀就有點週期的感覺了。

因為加上漢明窗,只有中間的資料體現出來了,兩邊的資料資訊丟失了,所以等會移窗的時候,只會移1/3或1/2窗,這樣被前一幀或二幀丟失的資料又重新得到了體現。

簡單的說漢明窗就是個函式,它的形狀像窗,所以類似的函式都叫做窗函式。

加hanmming窗的作用

在對訊號進行lpc分析前,對訊號乘以乙個hamming 窗。乘法是:訊號直接乘以乙個hammingwindowtable中的值。如果是限制頻寬的話, 在時域應對訊號應做卷積的。

因為要處理的是無限長序列中的一段,所以必須對這段序列加窗採集出來。

漢明窗函式為

w(n,α ) = (1 -α ) - α cos(2pin/(n-1)),0≦n≦n-1

一般情況下,α取0.46

由於直接對訊號(加矩形窗)截斷會產生頻率洩露,為了改善頻率洩露的情況,加非矩形窗,一般都是加漢明窗,因為漢明窗的幅頻特性是旁瓣衰減較大,主瓣峰值與第乙個旁瓣峰值衰減可達40db。

Hamming Distance 漢明距離

在資訊理論中,hamming distance 表示兩個等長字串在對應位置上不同字元的數目,我們以d x,y 表示字串x和y之間的漢明距離。從另外乙個方面看,漢明距離度量了通過替換字元的方式將字串x變成y所需要的最小的替換次數。舉例說明以下字串間的漢明距離為 karolin and kathrin ...

漢明距離總和

題目 兩個證書的漢明距離指的是這兩個數字的二進位制數對應值不同的數量。計算乙個陣列中,任意兩個數之間漢明距離的總和。示例 輸入 4,14,2 輸出 6 解釋 在二進位制表示中,4表示為0100,14表示為1110,2表示為0010。這樣表示是為了提現後四位之間的關係 所以答案為 hammingdis...

Hamming Distance漢明距離

漢明距離是使用在資料傳輸差錯控制編碼裡面的,漢明距離是乙個概念,它表示兩個 相同長度 字對應位不同的數量,我們以d x,y 表示兩個字x,y之間的漢明距離。對兩個字串進行異或運算,並統計結果為1的個數,那麼這個數就是漢明距離。在資訊理論中,兩個等長字串之間的漢明距離是兩個字串對應位置的不同字元的個數...