筆記 數字語音編碼基礎概念

2021-10-09 16:11:14 字數 1675 閱讀 1889

聲音是什麼

聲音是聽覺器官對聲波的感知,而聲波是通過空氣或其他**傳播的連續振動。聲音的強弱體現在聲波壓力的大小上,音調的高低體現在聲音的頻率上

頻率

訊號的頻率是指訊號每秒鐘變化的次數,用hz表示

頻率為20hz~20khz的訊號都稱為聲音,20hz ~ 20khz範圍的頻率稱為聲音頻率,簡稱為「音訊(聲率)」

高保真聲音(high fidelity audio): 10 ~ 20 000hz;

聲音(audio/ sound); 20 ~ 20000hz;

語音( speech/ voice) : 300 ~ 3400hz;

亞音(subsonic):< 20hz;

超聲(ultrasonic): > 20000hz。

此外,語音還有窄帶語音和寬頻語音之分。窄帶語音頻號的頻率範圍為300~3400hz,寬頻語音頻號的頻率範圍為50 ~ 7000hz

模擬訊號與數碼訊號

把在時間和幅度上都是連續的訊號稱為模擬訊號

在某些特定的時刻對這種模擬訊號進行測量叫作取樣,由這些特定時刻取樣得到的訊號稱為離散時間訊號

把訊號幅度取值的數目加以限定,這種由無限數目的數值組成的訊號就稱為離散幅度訊號。

把時間和幅度都用離散的數字表示的訊號稱為數碼訊號

數位化概念

數位化實際上就是取樣和量化。連續時間的離散化通過取樣來實現,就是每隔相等的一段時間取樣一次,這 種取樣稱為均勻取樣;連續幅度的離散化通過量化來實現,就是把訊號幅度劃分為若干段,如果幅度的劃分是等間隔的,就稱為線性量化.否則就稱為非線性量化。

取樣速率

取樣速率的高低由訊號本身包含的最高頻率決定,訊號的頻率越高,需要取樣速率就越高,但不要太高。取樣速率不應低於聲音頻號最高頻率的兩倍,這樣就能把以數字表達的聲音還原成原來的聲音,這叫作無損數位化。

取樣精度

精度是度量模擬訊號的最小單位,稱為量化階

例如將0~1v的電壓用256個數表示時,他的量化階等於1/256v

樣本位數的大小影響到聲音的質量,位數越多,聲音質量越高,所需的儲存空間就越多;位數越少,聲音質量越低,所需儲存空間也越少

取樣精度的另一種表示方法是訊號訊雜比,簡稱訊雜比(snr)單位為分貝(db)

波形編碼

波形編碼是用數字形式精確地表示模擬訊號波形的編碼方法,在不考慮語音產生和感知特性的情況下,波形編碼器輸出的資料速率為9.6~64kbps或更高

引數編碼

引數編碼是使用發音器官生成語音頻號的模型,對從語音頻號中抽出語音的特徵引數(如發音模型、有聲/無聲、音量大小、音調)進行編碼的方法,解碼器根據模型引數重構語音頻號。引數編碼器輸出的資料速率約為2~4.8kbps

混合編碼

混合編碼是綜合使用波形編碼和聲源編碼技術,組合波形特性和語音特徵引數的編碼方法。混合編碼既有波形編碼語音質量高的優點,又有引數編碼資料速率低的優點,主要用在語音質量要求高的移動通訊系統。混合編碼器輸出的資料速率為4. 0~ 16kbps

參考

《多**技術基礎》

Python學習筆記 數字

python支援整型 int 浮點型 float 複數 complex true 和 false 定義成關鍵字了,它們的值是 1 和 0,可以和數字相加。python中的整型不限制大小。複數由實數部分和虛數部分構成,可以用a bj或complex a,b 表示,複數的實部a和虛部b都是浮點型。使用i...

演算法筆記 數字dp

前言 當我們遇到某些題目的時候 比如像讓你統計l r這乙個區間內的數字和以及滿足條件的數有幾個這一類的題目 常常會因為區間太大而無法計算。這時候,我們就需要用上我們偉大的數字dp啦 數字dp的實質就是換一種暴力列舉的方式,使得新的列舉方式滿足dp的性質,然後記憶化就可以了。nm這本質上不還是記憶化搜...

Python學習筆記 數字型別與基礎運算

python的數字型別包括 任何僅含數字的序列在python都被認為是整數,可以單獨使用數字0,但不能作為字首放在其它數字前面。除了十進位制,python還可以使用其它進製的數字 輸入其它進製的數字,python會列印出對應的十進位制整數 0b10 2python在處理超大整數時不會產生任何錯誤。浮...