分層取樣(stratified sampling)

2021-07-25 05:30:32 字數 494 閱讀 2752

保留類別比例的取樣方式。

先將總體的單位按某種特徵分為若干次級總體(層),然後再從每一層內進行單純隨機抽樣,組成乙個樣本。分層可以提高總體指標估計值的精確度,它可以將乙個內部變異很大的總體分成一些內部變異較小的層(次總體)。

每一層內個體變異越小越好,層間變異則越大越好。
分層抽樣比單純隨機抽樣所得到的結果準確性更高,組織管理更方便,而且它能保證總體中每一層都有個體被抽到。這樣除了能估計總體的引數值,還可以分別估計各個層內的情況,因此分層抽樣技術常被採用。

例項介紹

例如,通過對包含1000個樣本的資料集d進行分層抽樣而獲得70%樣本的訓練集s和含30%樣本的測試集t,若d包含500個正例、500個反例,則分層取樣得到的s應包含350個正例、350個反例,而t則包含150個正例、150個反例;

若s、t中樣本類別比例差別很大,則誤差估計將由於訓練/測試資料分布的差異而產生偏差。

降取樣,過取樣,欠取樣,子取樣,下取樣,上取樣

取樣 2048hz對訊號來說是過取樣了,事實上只要訊號不混疊就好 滿足尼奎斯特取樣定理 所以可 以對過取樣的訊號作抽取,即是所謂的 降取樣 在現場中取樣往往受具體條件的限止,或者不存在300hz的取樣率,或除錯非常困難等等。若 r 1,則rfs 2就遠大於音訊訊號的最高頻率fm,這使得量化雜訊大部分...

降取樣,過取樣,欠取樣,子取樣,下取樣,上取樣

取樣 2048hz對訊號來說是過取樣了,事實上只要訊號不混疊就好 滿足尼奎斯特取樣定理 所以可 以對過取樣的訊號作抽取,即是所謂的 降取樣 在現場中取樣往往受具體條件的限止,或者不存在300hz的取樣率,或除錯非常困難等等。若 r 1,則rfs 2就遠大於音訊訊號的最高頻率fm,這使得量化雜訊大部分...

降取樣,過取樣,欠取樣,子取樣,下取樣

這幾天看了一篇將關於降取樣,過取樣,欠取樣,子取樣,下取樣 的文章,寫的挺好的,直接給出鏈結,文章比較長不貼過來了。簡單的說 過取樣是取樣頻率大於最高頻率的兩倍 奈奎斯特取樣率 實際對低通訊號取樣也是2.5倍左右過取樣。欠取樣就是小於奈奎斯特取樣率,應該就指帶通取樣吧。上取樣和下取樣其實對數碼訊號進...