音訊處理中的尺度 Bark尺度與Mel尺度

2021-07-13 04:19:30 字數 1611 閱讀 4204

由於人耳對聲音的感知(如:頻率、音調)是非線性的,為了對聲音的感知進行度量,產生了一系列的尺度(如:十二平均律),這裡重點說下bark尺度與mel尺度。剛開始的時候,我自己也沒弄明白這兩個尺度的區別。後來才逐漸的明白他們的思考出發點,這裡簡單分享出來。

bark(巴克)頻率尺度是以hz為單位,把頻率對映到心理聲學的24個臨界頻帶上,第25個臨界頻帶佔據約:16k~20khz的頻率,1個臨界頻帶的寬度等於乙個bark,簡單的說,bark尺度是把物理頻率轉換到心理聲學的頻率。bark尺度頻率的中心頻率與臨界頻寬邊界頻率如下表所示:

臨界頻帶

頻率/hz

bark頻帶

中心頻率

下界頻率

上界頻率150

0100

2150

100200

3250

200300

4350

300400

5450

400510

6570

510630

7700

630770

8840

770920

91000

9201080

101170

1080

1270

111370

1270

1480

121600

1480

1720

131850

1720

2000

142150

2000

2320

152500

2320

2700

162900

2700

3150

173400

3150

3700

184000

3700

4400

194800

4400

5300

205800

5300

6400

217000

6400

7700

228500

7700

9500

2310500

9500

12000

2413500

12000

15500

2518775

15500

22050

我發現有不少式子試圖對上表進行建模,用的比較多的乙個式子是(zwicker,terhardt 1980):

\[b = 13}\left( }}} \right) + 3.5}}} \right)^2}\]

上式中頻率f代表中心頻率,我把上面的式子在matlab中代入進行計算,發現前5個bark頻帶與計算出來的出入比較大,尚不知道這是什麼原因。

mel頻率尺度也是一種頻率對映感知模型,它描述的是音高感知的非線性對映,函式表示如下:

\[m = 1127.01048\left( }} \right)\]

要注意的一點是,這裡的頻率f單位是1khz,也就是說,1khz是mel頻率與以赫茲為單位的真實頻率之間的參考點(1khz=1000mel),另一方面,mel一詞**於**術語melody,是旋律的頻率分量與與音高感知之間距離的度量。

什麼是「與尺度無關的」變數

welcome to my blog 今天 學習目標檢測 時 碰到了與尺度無關的平移量和與尺度無關的縮放量,什麼是與尺度無關呢?尺度是什麼?以為例,假設有各種各樣尺寸的,不同的尺寸就是不同的尺度,與尺度無關就是與不同的尺寸無關 要想獲得與尺度無關的變數,對變數進行歸一化即可,比如的寬是w,在寬這個維...

小波分析中的尺度函式與小波函式

如題,我想問問尺度因子a和尺度函式一樣嗎?如果不一樣那他們之間有什麼聯絡呢?非常感謝 不一樣,尺度因子只是個尺度函式中的係數 尺度函式對應影象二維小波變換中的近似子帶 小波函式對應細節子帶。如果尺度函式為 2 a x i 則尺度因子a越大尺度函式生成的向量空間越大,波形越小。尺度函式與小波函式 對於...

IOS開發中(null)與的處理

不小心在開發過程中,得到了 null 以及的返回值,找了好長時間只找到了乙個關於的。由於要根據返回值進行判斷,做出必要反應,因此必須知道返回值所代表的具體字元,在得到 null 後利用isequal 和 null,null nil,nil比較後均得不到正確結果,弄得不知所措了,但是還是感覺像nil,...