音訊訊號的數位化及壓縮編碼

2021-07-28 09:35:26 字數 1377 閱讀 8658

電視廣播離不開聲音頻號,隨著人們對電視質量的要求越來越高,在數字電視廣播、高畫質晰數碼電視和數字電影中不僅應有高質量的影象,還要保證有高質量的伴音。

我們行業標準gy/t 156-2000《演播室數字音訊引數》中對音訊訊號的取樣頻率、量化位元數和聲道數等作出了規定。

1.取樣頻率:演播室數字音訊引數標準規定,音訊訊號的取樣頻率優選為48khz,也可以選用32khz或44.1khz。

2.量化位元數:演播室數字音訊編碼方式優選pcm20bit線性量化,也可以選用16bit、18bit以及24bit的線性量化。

3.編碼方式:為了減小誤碼對訊號幅度的影響,在數字音訊編碼中通常不採用自然二進位製碼或偏置二進位製碼,而是採用2的補碼,這樣可以防止產生不希望的噪音。

另外標準中還對4軌聲音記錄格式和8軌聲音記錄格式作出了規定。

音訊訊號數位化之後所面臨的問題是巨大的資料量如何進行有效地傳輸和儲存的問題,在數字演播室中,無壓縮的有效位元速率高達1.92mb/s,而在cd和廣播該項數值分別為1.41 mb/s和1 mb/s,因此為了提高傳輸效率,降低儲存費用,就必須對數字音訊訊號進行壓縮編碼。

1.去除聲音頻號中的冗餘部分

聲音頻號中的冗餘部分包括時域資訊冗餘和頻域資訊冗餘。

a.其中時域資訊冗餘主要表現在:1.幅度非均勻分布,即不同幅度的樣值出現的概率不同,小幅度的樣值比大幅               度的樣值出現的概率高;2.樣本之間的相關性;3.基音之間的相關性。

b.頻率資訊冗餘主要表現在:1.非均勻功率譜密度,低頻成分能量較高,高頻成分能量較低;2.語音特有的短時             功率譜密度,在某些頻率出現峰值,而某些頻率出現谷值。

2.利用人耳的聽覺特性

a.人耳對各頻率的靈敏度是不同的,即在不同的頻率,人耳會表現出不同的敏感度。因此可以將輸入訊號與最小            聽覺閾值相比較,去除那些低於閾值的訊號,這樣就可以壓縮資料。

b.頻率之間的掩蔽效應,這是指人耳接受訊號時,不同頻率之間的相互干擾。例如當高電平的頻率點訊號和低電            平的不同頻率點訊號同時出現時,電平較低的頻率點的聲音將聽不到。這樣可以將低於掩蔽閾值的訊號不編                碼,高於掩蔽閾值的訊號將重新分配量化位元值。

c.時域掩蔽效應,這是指在乙個強訊號之前或之後的弱訊號也會被遮蔽掉。

利用人耳的感覺特性對資料流進行壓縮,是既能得到較高的壓縮比又能保證音質的重要原因。

通常用以下屬性來衡量數字音訊訊號的編碼質量:

1.位元率;2.主觀/客觀的語音質量;3.計算複雜度;4.延遲量;5.對於通道誤碼的靈敏度

隨著數碼電視技術和多**通訊技術的廣泛應用,數字音訊壓縮編碼技術在近20年也得到了快速的發展。典型的編碼標準有:mpeg-1、mpeg-2 audio、mpeg-2 aac、mpeg-4 audio和dolby ac-3音訊編碼標準等。

聲音的數位化表示

在現代通訊及計算機應用中,資訊都是以二進位制數的形式儲存及傳遞的,聲音也不例外。聲音頻號的數位化就是用二進位制數表示聲音的模擬訊號。聲音的資訊表示過程是這樣的 聲音 取樣 量化 編碼 數字音訊。所謂取樣,就是在某些特定的時刻對模擬聲音頻號進行測量,得到離散時間訊號。其原理是首先輸入模擬訊號,然後按照...

美元數位化的利與弊

美元數位化將開啟 美元二元化 時代,亦即銀行美元與數字美元的競爭與協作程序。究其原因,數字美元一定會擠出或替代部分銀行美元,這可以理解為美元地位至少在短期內的削弱,亦可以理解為美元數位化的 摩擦成本 整體看,這個摩擦成本是美元體系所承受得起的,而具體看,這個摩擦成本並不是整體性的,更不是全域性性的,...

我的「數位化」轉型

我從業資訊化行業已九年,一直在製造業公司工作,一直以來我在思考兩個問題 1 什麼是資訊化和數位化。2 資訊化如何能提高製造業產品質量 提公升生產效率 降低成本。1 關於資訊化和數位化。如果從資訊理論的角度去思考 資訊的基本作用就是消除人們對事物的不確定性,乙個系統越是有序,資訊熵就越低,反之,乙個系...