資料壓縮 實驗六 MPEG音訊編碼實驗

2021-08-03 14:52:03 字數 3409 閱讀 1055

下圖為mpeg音訊編碼layerii流程圖:

32個子帶濾波器組:

通過子帶分析濾波器組使訊號具有高的時間解析度,確保在短暫衝擊訊號情況下,編碼的聲音頻號具有足夠高的質量。

將pcm樣本變換到32個子帶的頻域訊號:如果輸入的取樣頻率為48khz ,那麼子帶的頻率寬度為48/ (2*32 )=0.75hz

該多相濾波器組為如下圖:

心理聲學模型:

計算訊號中不可聽覺感知的部分。

時頻分析的矛盾:

1、通過子帶分析濾波器組使訊號具有高的時間解析度,確保在短暫衝擊訊號情況下,編碼的聲音頻號具有足夠高的質量

2、又可以使訊號通過fft運算具有高的頻率解析度,因為掩蔽閾值是從功率譜密度推出來的。

在低頻子帶中,為了保護音調和共振峰的結構,就要求用較小的量化階、較多的量化級數,即分配較多的位數來表示樣本值。而話音中的摩擦音和類似雜訊的聲音,通常出現在高頻子帶中,對它分配較少的位數。

步驟:

將樣本變換到頻域->確定聲壓級別->考慮安靜時閾值->將音訊訊號分解成「樂音(tones)」 和「非樂音/雜訊」部分:因為兩種訊號的掩蔽能力不同->音調和非音調掩蔽成分的消除->單個掩蔽閾值的計算->全域性掩蔽閾值的計算->每個子帶的掩蔽閾值->計算每個子帶訊號掩蔽比(signal-to-maskratio, smr)

位元分配過程:

使整幀和每個子帶的總雜訊—掩蔽比最小。

演算法:迴圈,直到沒有位元可用:

1、對每個子帶計算掩蔽-雜訊比mnr,mnr = snr –smr (db)

2、對最低mnr的子帶分配位元,使獲益最大的子帶的量化級別增加一級

3、重新計算分配了更多位元子帶的mnr

理解程式設計的整體框架

理解感知音訊編碼的設計思想

兩條線

時-頻分析的矛盾!

理解心理聲學模型的實現過程

臨界頻帶的概念

掩蔽值計算的思路

理解位元速率分配的實現思路

輸出音訊的取樣率和目標位元速率

選擇某個資料幀,輸出

該幀所分配的位元數

該幀的比例因子

該幀的位元分配結果

資料壓縮實驗六 MPEG音訊編碼

mpeg 1 audio layerii編碼器原理 對各個子帶每12個樣點進行一次比例因子計算。先定出12個 樣點中絕對值的最大值。查比例因子表中比這個最大值大的 最小值作為比例因子。用6位元表示。第2層的一幀對應36個子帶樣值,是第1層的三倍,原 則上要傳三個比例因子。為了降低比例因子的傳輸碼率,...

資料壓縮 MPEG音訊編碼

一.實驗原理 2.mpeg 1音訊編碼器框架圖 多相濾波器組 polyphasefilter bank 將pcm 樣本變換到 32個子帶的頻域訊號 如果輸入的取樣頻率為 48khz 那麼子帶的頻率寬度為 48 2 32 0.75hz 心理聲學模型 psychoacousticmodel 計算訊號中不...

資料壓縮試驗 MPEG音訊編碼

框架圖 計算訊號中不可聽覺感知的部分 計算雜訊遮蔽效應 mpeg 1定義了兩種模型。心理聲學模型1 計算複雜度低,但對假設使用者聽不到的部分壓縮太嚴重 心理聲學模型2 1.將樣本變換到頻域 32個等分的子帶訊號並不能精確地反映人耳的聽覺特性。引入fft補償頻率解析度不足的問題。模型1 採用512 l...