語音壓縮思路

2021-08-10 04:17:30 字數 788 閱讀 7525

從中通濾波開始,先濾除語音之外的頻段。

根據夏農-乃奎斯特定律,取樣率需要為最高頻段的2倍,通過步驟1可以降低取樣率。

用盡可能低的頻率進行取樣。

pcm調製與pwm調製。

人能夠承受的最大動態範圍約120db,am收音機是48db,故認為48db已經足夠還原人聲。

根據6db規則,使用8位資料字寬既能夠滿足上述要求,

壓縮編碼方式選擇

優先選擇:voip使用的lpc(linear predictive coding,線性**編碼)

備用選擇:celp(code excited linear prediction碼激勵線性**編碼)

參考《各種音訊編碼方式的對比》

型別:audio

制定者:

所需頻寬:2kbps-4.8kbps

特性:壓縮比大,計算量大,音質不高,廉價

優點:壓縮比大,廉價

缺點:計算量大,語音質量不是很好,自然度較低

應用領域:voip

版稅方式:free

備註:引數編碼又稱為聲源編碼,是將信源訊號在頻率域或其它正交變換域提取特徵引數,並將其變換成數字**進行傳輸。解碼為其反過程,將收到的數字串行經變換恢復特徵參量,再根據特徵參量重建語音頻號。具體說,引數編碼是通過對語音頻號特徵引數的提取和編碼,力圖使重建語音頻號具有盡可能高的準確性,但重建訊號的波形同原語音訊號的波形可能會有相當大的差別。如:線性**編碼(lpc)及其它各種改進型都屬於引數編碼。該編碼位元率可壓縮到2kbit/s-4.8kbit/s,甚至更低,但語音質量只能達到中等,特別是自然度較低。

矩陣壓縮儲存思路

為什麼矩陣要進行壓縮儲存?為了節省空間。我們對相同的元素或者零不再分配空間,把二維的矩陣壓縮存進一維陣列中 能進行壓縮儲存的矩陣稱為特殊矩陣 特殊矩陣主要包括 n階對稱矩陣 上三角矩陣 下三角矩陣 稀疏矩陣 n階對稱矩陣的條件如下 a i j a j i 1 i,j n 因為是把二維陣列存入一維陣列...

語音壓縮演算法測評及質量評估

1.語音壓縮的基本依據 從資訊保持的角度講,只有當信源本身具有冗餘度,才能對其進行壓縮。根據統計分析的結果,語音頻號中存在著多種冗餘度m,主要有以下幾個方面 1.幅度非均勻分布 語音中小幅度樣本比大幅度樣本出現的概率要高。又由於通話必然會有間隙,更出現了大it的低電平樣本。此外,實際語音頻號的功率電...

壓縮docker層數的新思路

隨著不斷構建docker映象,造成了映象越來越大 那麼我們可以在目標映象中先壓縮整個系統 1.刪除多餘檔案 2.壓縮整個系統 3.拖拽輕量級映象 docker run tdi name ubuntu1 ubuntu bin bash 4.docker cp 備份檔案 ubuntu1 備份檔案 5.解...