統計學基礎知識精講

2021-09-26 04:20:20 字數 532 閱讀 4893

1、回歸評價指標mse、rmse、mae、r-squared的分析可以參閱這裡:

2、置信區間與置信水平(置信度)可以參閱這裡:

3、正規化可以參閱這裡:

4、方差計算公式的分母究竟是n還是n-1?

如果要計算整體樣本的方差(例如只是想計算一組資料的方差),那麼方差計算公式如下:

如果想通過計算部分樣本的方差,並將此方差值作為整體樣本的無偏估計,則計算方法如下:

為何計算部分樣本的方差,並將此方差值作為整體樣本的無偏估計時,方差計算公式的分母是n-1?針對這個問題,答案是除了下面兩種情況分母是n以外,剩餘情況均是n-1。

第一種情況,部分樣本均值的方差為0,樣本沒有波動,即:

第二種情況,事先知道整體均值μ。

詳細分析請看這裡。

統計學基礎知識(二)

一 中心極限定理 1.定義 這與x符合正態分佈時的唯一差別是 樣本的大小無所謂。所以可以總結出這樣一句話來 根據中心極限定理,如果總體的樣本很大,則樣本均值的分布近似為正態分佈。來看看均值和方差的推導過程 2.使用中心極限定理 1 二項分布 2 泊松分布 此時計算樣本均值的概率可以說是非常容易了,因...

統計學 統計學基礎

五種抽樣方法 1 簡單隨機 選取熱量相同且每個樣本有同等概率被選擇的樣本 2 系統 簡單的系統抽取樣本 3 任意 使用乙個碰巧很容易被選擇的樣本 4 整群 先將總體分為不同組群,從中隨機挑選幾個組群作為樣本 5 分層 定義層級,在每個層級隨機抽取樣本。抽樣方法的選擇一定要符合 1 只有樣本對總體具有...

機器學習基礎知識精講

1 超引數 在機器學習的上下文中,超引數是在開始學習過程之前設定值的引數,而不是通過訓練得到的引數資料。通常情況下,需要對超引數進行優化,給學習機選擇一組最優超引數,以提高學習的效能和效果。超引數的一些示例 a 樹的數量或樹的深度 b 矩陣分解中潛在因素的數量 c 學習率 多種模式 d 深層神經網路...