語音頻號處理初學者概念總結

2021-06-20 16:50:56 字數 4892 閱讀 7480

1. 頻譜就是頻率的分布曲線,複雜振盪分解為振幅不同和頻率不同的諧振蕩,這些諧振蕩的幅值按頻率排列的圖形叫做頻譜。廣泛應用在聲學、光學和無線電技術等方面。 頻譜是頻率譜密度的簡稱。它將對訊號的研究從時域引到頻域,從而帶來更直觀的認識。

2. 把殘差訊號可能出現的、已經量化了的、按一定規則排列的各種樣值事先儲存在儲存器中,好像一本字典一樣。每乙個樣值組合都有一位址碼,所以這個儲存器就稱為碼本。

3. 奈奎斯特頻率(nyquist frequency)是離散訊號系統取樣頻率的一半,因哈里·奈奎斯特(harry nyquist)或奈奎斯特-夏農取樣定理得名。取樣定理指出,只要離散系統的奈奎斯特頻率高於取樣訊號的最高頻率或頻寬,就可以避免混疊現象。   

從理論上說,即使奈奎斯特頻率恰好大於訊號頻寬,也足以通過訊號的取樣重建原訊號。但是,重建訊號的過程需要以乙個低通濾波器或者帶通濾波器將在奈奎斯特頻率之上的高頻分量全部濾除,同時還要保證原訊號中頻率在奈奎斯特頻率以下的分量不發生畸變,而這是不可能實現的。在實際應用中,為了保證抗混疊濾波器的效能,接近奈奎斯特頻率的分量在取樣和訊號重建的過程中可能會發生畸變。因此訊號頻寬通常會略小於奈奎斯特頻率,具體的情況要看所使用的濾波器的效能。   

需要注意的是,奈奎斯特頻率必須嚴格大於訊號包含的最高頻率。如果訊號中包含的最高頻率恰好為奈奎斯特頻率,那麼在這個頻率分量上的取樣會因為相位模糊而有無窮多種該頻率的正弦波對應於離散取樣,因此不足以重建為原來的連續時間訊號。

4. 取樣頻率,也稱為取樣速度或者取樣率,定義了每秒從連續訊號中提取並組成離散訊號的取樣個數,它用赫茲(hz)來表示。取樣頻率的倒數是取樣週期或者叫作取樣時間,它是取樣之間的時間間隔。通俗的講取樣頻率是指計算機每秒鐘採集多少個聲音樣本,是描述聲音檔案的音質、音調,衡量音效卡、聲音檔案的質量標準。

5. 工頻訊號就是頻率為50赫茲的訊號,可以是電流訊號,也可以是電壓訊號

6一般的聲音都是由發音體發出的一系列頻率、振幅各不相同的振動復合而成的。這些振動中有乙個頻率最低的振動,由它發出的音就是基音(fundamental tone),其餘為泛音。   

發音體整體振動產生的音,叫做基音,決定音高;   

發音體部分振動產生的音,叫做泛音,決定音色;   

基音和泛音結合一起而形成的音,叫做復合音,日常我們所聽到的聲音多為復合音。

7. 固有頻率科技名詞定義

中文名稱:固有頻率 英文名稱:natural frequency 

定義1:系統出現自由振盪的頻率。 應用學科:電力(一級學科);通論(二級學科) 

定義2:由系統本身的質量和剛度所決定的頻率。

n自由度系統一般有n個固有頻率,按頻率的高低排列,最低的為第一階固有頻率。有阻尼的線性系統的自由振動頻率稱為「阻尼固有頻率」。 應用學科:機械工程(一級學科);試驗機(二級學科);振動台與衝擊臺-振動台與衝擊臺一般名詞(**學科) 以上內容由全國科學技術名詞審定委員會審定公布   

物體作自由振動時,其位移隨時間按正弦規律變化,又稱為簡諧振動。簡諧振動的振幅及初相位與振動的初始條件有關,振動的週期或頻率與初始條件無關,而與系統的固有特性有關,稱為固有頻率或者固有週期。   

物體頻率與它的硬度、質量、外形尺寸有關,當其發生形變時,彈力使其恢復。彈力主要與尺寸和硬度有關,質量影響其加速度。同樣外形時,硬度高的頻率高,質量大的頻率低。 乙個力統的質量分布,內部的彈性以及其他的力學性質決定。如彈簧振子的。   

人體的固有頻率   

正常人體的固有頻率應為7.5hz左右,其中各部分又有自己的固有頻率。如內臟為4~6hz,頭部為8~12hz等。正是由於這個原因,次聲波對人體有很大的破壞作用,因為人體各部分的固有頻率都在次聲波的頻率範圍之內。次聲**就是利用頻率低於20hz的次聲波與人體發生共振,使共振的器官或部位發生位移和變形而造**體損傷以至死亡的一種**。

8. 共鳴

發聲器件的頻率如果與外來聲音的頻率相同時(即音調相同),則它將由於共振的作用而發聲,這種聲學中的共振現象叫作「共鳴」。

9. 諧振科技名詞定義

中文名稱:諧振 英文名稱:resonance  其他名稱:共振 

定義:強迫振盪頻率非常接近於自由振盪頻率的系統中出現的振盪現象。 定義

在物理學裡,有乙個概念叫共振:當策動力的頻率和系統的固有頻率相等時,系統受迫振動的振幅最大,這種現象叫共振。電路裡的諧振其實也是這個意思:當電路中激勵的頻率等於電路的固有頻率時,電路的電磁振盪的振幅也將達到峰值。實際上,共振和諧振表達的是同樣一種現象。這種具有相同實質的現象在不同的領域裡有不同的叫法而已。 應用

收音機利用的就是諧振現象。轉動收音機的旋鈕時,就是在變動裡邊的電路的固有頻率。忽然,在某一點,電路的頻率和空氣中原來不可見的電磁波的頻率相等起來,於是,它們發生了諧振。遠方的聲音從收音機中傳出來。這聲音是諧振的產物。 

10. 帶通濾波器(band-pass filter)是乙個允許特定頻段的波通過同時遮蔽其他頻段的裝置。比如rlc振盪迴路就是乙個模擬帶通濾波器。

11. 取樣頻率科技名詞定義

中文名稱:取樣頻率 英文名稱:sampling frequency 

定義:在模數轉換器中取樣時間間隔的倒數。是微機型繼電保護裝置的乙個重要引數。 應用學科:電力(一級學科);繼電保護與自動化(二級學科) 以上內容由全國科學技術名詞審定委員會審定公布 

取樣頻率,也稱為取樣速度或者取樣率,定義了每秒從連續訊號中提取並組成離散訊號的取樣個數,它用赫茲(hz)來表示。取樣頻率的倒數是取樣週期或者叫作取樣時間,它是取樣之間的時間間隔。通俗的講取樣頻率是指計算機每秒鐘採集多少個聲音樣本,是描述聲音檔案的音質、音調,衡量音效卡、聲音檔案的質量標準。

取樣頻率只能用於週期性取樣的取樣器,對於非週期性取樣的取樣器沒有規則限制。   取樣頻率的常用的表示符號是 fs。   通俗的講取樣頻率是指計算機每秒鐘採集多少個聲音樣本,是描述聲音檔案的音質、音調,衡量音效卡、聲音檔案的質量標準。取樣頻率越高,即取樣的間隔時間越短,則在單位時間內計算機得到的聲音樣本資料就越多,對聲音波形的表示也越精確。取樣頻率與聲音頻率之間有一定的關係,根據奈奎斯特理論,只有取樣頻率高於聲音頻號最高頻率的兩倍時,才能把數碼訊號表示的聲音還原成為原來的聲音。這就是說取樣頻率是衡量聲卡採集、記錄和還原聲音檔案的質量標準。

12. 頻域frequency domain 

是描述訊號在頻率方面特性時用到的一種座標系。對任何乙個事物的描述都需要從多個方面進行,每一方面的描述僅為我們認識這個事物提供部分的資訊。例如,眼前有一輛汽車,我可以這樣描述它方面1:顏色,長度,高度。方面2:排量,品牌,**。而對於乙個訊號來說,它也有很多方面的特性。如訊號強度隨時間的變化規律(時域特性),訊號是由哪些單一頻率的訊號合成的(頻域特性)

13. 時域是描述數學函式或物理訊號對時間的關係。例如乙個訊號的時域波形可以表達訊號隨著時間的變化。   

若考慮離散時間,時域中的函式或訊號,在各個離散時間點的數值均為已知。

若考慮連續時間,則函式或訊號在任意時間的數值均為已知。   

在研究時域的訊號時,常會用示波器將訊號轉換為其時域的波形。   

時域是真實世界,是惟一實際存在的域。因為我們的經歷都是在時域中發展和驗證的,已經習慣於事件按時間的先後順序地發生。而評估數字產品的效能時,通常在時域中進行分析,因為產品的效能最終就是在時域中測量的。

14. 時間解析度是指在同一區域進行的相鄰兩次遙感觀測的最小時間間隔。對軌道衛星,亦稱覆蓋週期。時間間隔大,時間解析度低,反之時間解析度高。時間解析度是評價遙感系統動態監測能力和「多日攝影」系列遙感資料在多時相分析中應用能力的重要指標。根據地球資源與環境動態資訊變化的快慢,可選擇適當的時間解析度範圍。按研究物件的自然歷史演變和社會生產過程的週期劃分為5種型別:①超短期的。如颱風、寒潮、海況、魚情、城市熱島等,需以小時計;②短期的。如洪水、冰凌、旱澇、森林火災或蟲害、作物長勢、綠被指數等,要求有以日數計;③中期的。如土地利用、作物估產、生物量統計等,一般需要以月或季度計;④長期的。如水土保持、自然保護、冰川進退、湖泊消長、海岸變遷、沙化與綠化等,則以年計;⑤超長期的。如新構造運動、火山噴發等地質現象,可長達數十年以上。 

15. 預回聲:音訊編碼技術中的預回聲失真一直是乙個相當棘手的問題[1],特別當位元率較低時,亦即壓縮比較高時,預回聲將變得更加明顯和嚴重。預回聲失真產生的關鍵原因是:時間解析度的不足造成量化雜訊的時域擴散。特別當乙個瞬態訊號被分塊變換(或濾波)到

改回頻域進行量化編碼時,由於量化雜訊被擴散到整個變換塊(或濾波器組)範圍上,而且如果不能被訊號掩蔽,就會出現預回聲。預回聲造成訊號波形失真的例子如圖1所示,顯然在突發訊號前出現了明顯的量化雜訊,且人耳對此類失真很敏感。

17. 基音週期

人在發濁音時,氣流通過聲門使聲帶產生張馳振盪式振動,產生一股準週期脈衝氣流,這一氣流激勵聲道就產生濁音,又稱有聲語音,它攜帶著語音中的大部分能量。這種聲帶振動的頻率稱為基頻,相應的週期就稱為基音週期(pitch),它由聲帶逐漸開啟到面積最大(約佔基音週期的50%)、逐漸關閉到完全閉合(約佔基音週期的35%)、完全閉合(約佔基音週期的15%)三部分組成 。  

基音週期的估計稱為基音檢測 (pitch detection),基音檢測的最終目標是畫出和聲帶振動頻率完全一致的基音週期變化軌跡曲線,如不可能則盡量找出相吻合的軌跡曲線。   

在語音頻號處理中,語音頻號引數提取的準確性非常重要。只有獲得準確的引數,才能利用這些引數進行高效的處理,而在許多引數提取中,基音週期的提取尤為重要,廣泛地應用於語音壓縮編碼、語音分析合成以及語音識別等方面,所以,準確可靠地估計並提取基音週期對語音頻號處理至關重要 。它直接影響到合成語音是否真實再現原始語音頻號,影響到語音識別的識別率,影響到語音壓縮編碼的正確率。

18. 音量(volume):聲音的大小稱為音量,又稱為力度、強度(intensity)或是能量(energy)。音量越大,代表音訊波形的震幅越大。

音高(pitch):聲音的基本頻率(fundamental frequency)越高,代表音高越高(例如女高音的歌聲);反之,聲音的基本頻率越低,代表音高越低(例如男低音的歌聲)。(有關基本頻率的說明,將在本章其後各小節說明。)

音色(timber):音訊波形在每個週期內的變化,就形成了此音訊的音色。不同的音色即代表不同的音訊內容,例如不同的字有不同的發音,或是不同的歌手有不同的特色,這些都是由於音色不同而產生。

語音頻號處理

濁音的聲帶振動基本頻率 fundamental frequency 稱為基音頻率。濁音的基音頻率 pitch 語音生成系統和語音感知系統 語音頻號生成的數學模型 語音頻號的特性分析 語音頻號處理是以語音語言學和數字訊號處理為基礎的綜合性學科,是用數字訊號處理技術對語音頻號進行處理的一門學科。說話人識...

css總結 初學者

position absolute 絕對定位 position relative 相對定位 position static 靜態定位 position sticky是乙個新的css3屬性,它的表現類似position relative和position fixed的合體,在目標區域在螢幕中可見時,它...

語音頻號的預處理

2014年09月05日 綜合 共 1116字 字型大小 小 中 大 回顧上兩次的內容 上次主要說了音訊檔案的讀取 主要是matlab和c語言 感覺有幾個概念有點混淆 語音 音訊 語音英文是speech,音訊是audio,是music。據我的理解是音訊包括語音和 不知道這麼理解對不?此外,讀取音訊其實...