音訊基礎學習(未完)

2021-05-28 08:35:57 字數 780 閱讀 6511

1.取樣頻率(sampling rate)

取樣頻率是指每秒鐘抽取聲波幅度樣本的次數,其單位為hz(赫茲)。取樣頻率不應低於原始聲音的最高頻率的2倍,這樣才能把以數字表達的聲音還原成原來的聲音。

2.取樣精度(bit resolution)

用於描述每個聲音樣本的振幅大小或者聲音樣本資料的二進位制位數。

3.量化

這個過程就是把整個振幅劃分成有限個小幅度,每乙個有限的小幅度賦予相同的乙個量化值(振幅狀態),用於表示取樣精度可以描述的振幅狀態的數量。

(1)均勻量化:也就是採用相等的量化間隔來度量取樣得到的幅度。這種方法對於輸入訊號不論大小一律採用相同的量化間隔,其優點在於獲得的音訊品質較高,而其缺點在於音訊檔案容量較大。

(2)非均勻量化:即對輸入的訊號採用不同的量化間隔進行量化。對於小訊號採用小的量化間隔,對於大訊號採用大的量化間隔。雖然非均勻量化後檔案容量相對較小,但對於大訊號的量化誤差較大。

聲音的屬性:

音的高低是由發音源在一定時間內的振動次數(頻率)來決定的。振動次數越多,頻率越高,音也就越高。反之則低;

音的長短是由發音源振動時所持續的時間來決定的。持續的時間越長,音越長,反之則短;

音的強弱取決於由發音源的振動幅度(振幅),幅度越大,音越強,幅度小音就弱;

而發音源的材質、形狀及泛音數的多少則決定了音色。

midi檔案是一種**演奏指令的序列,就像樂譜一樣,可以利用聲音輸出裝置或與電腦相 連的電子樂器進行演奏,由於不包含具體聲音資料,所以檔案較小。而聲音檔案則是通過錄音裝置錄製的原始聲音,直接記錄了真是聲音的二進位制取樣資料

音訊程式設計基礎

取樣 量化 編碼 取樣就是每隔一定時間就讀一次聲音頻號的幅度,而量化則是將取樣得到的聲音頻號幅度轉換為數字值,從本質上講,取樣是時間上的數位化,而量化則是幅度上的數位化。音訊取樣 自然界中音訊訊號是一種連續變化的模擬訊號,但計算機只能處理和記錄二進位制的數碼訊號,由自然音源得到的音訊訊號必須經過模數...

音訊基礎,筆記

常見44.1khz,48khz的取樣率,也就是取樣頻率,物理意義就是一秒鐘對音訊取樣的次數。由於人耳分辨的頻率範圍是20hz 20khz,根據奈奎斯特取樣定理,需要40khz來保證不失真。取樣精度是指每一次取樣的資料精度,比如常見的16bits,或者粗糙一些的8bits。l 16bits r 16b...

Caffe學習(未完)

在 caffe 中如何計算卷積 問題彙總待補充 caffe是大神賈揚清在加州伯克利大學博士期間開發的深度學習框架,在學界和工業界得到廣泛應用。caffe是cnn模型的非常好的框架,方便 易用 torch7是機器學習乙個非常好的框架,但是,學習曲線比caffe要陡峭一些。torch7更靈活,能搞定更多...