重溫概率學(一)期望 均值 標準差 方差

2022-01-31 06:34:31 字數 1437 閱讀 6809

概率

隨機變數:實驗的結果稱為隨機變數。

隨機變數分為:

因為隨機變數可以取不同的值,所以產出了概率分布的概念,統計學家用概率分布描述不同隨機變數發生的概率。因此有:

期望和均值

如果我們擲了無數次的骰子,然後將其中的點數進行相加,然後除以他們擲骰子的次數得到均值,這個有無數次樣本得出的均值就趨向於期望。

均值是針對樣本發生的頻率而言的,期望是針對樣本發生的概率分布而言的,所以總結後便是:

概率是頻率隨樣本趨於無窮的極限。

期望是均值隨樣本趨於無窮的極限。

上述表達的意思其實也就是弱大數定理

對於期望的理解:

理解1:

期望是反應樣本平均值的指標,但是個體資訊被壓縮,所以看乙個期望值的指標,需要採用「期望+數量」組合的方式去調研。

理解2:

平均數是根據實際結果統計得到的隨機變數樣本計算出來的算術平均值,和實驗本身有關,而數學期望是完全由隨機變數的概率分布所確定的,和實驗本身無關。

實驗的多少是可以改變平均數的,而在你的分布不變的情況下,期望是不變的。

期望(均值)、方差、標準差

方差:在概率論和數理統計中,方差(英文variance)用來度量隨機變數和其數學期望(即均值)之間的偏離程度.方差越大,隨機變數的結果越不穩定。常用來評估風險。

標準差:概念和方差一樣,都是表示樣本的離散程度。

標準差是一組數值自平均值分散開來的程度的一種測量觀念。乙個較大的標準差,代表一組資料裡大部分的數值和其平均值之間差異較大;乙個較小的標準差,代表這些數值較接近平均值。(eg:兩組數的集合 和 其平均值都是7,但第二個集合裡的數字明顯與7距離「更近」,通過公式算出第乙個集合的標準差約為4.9,第二個約為1.5。)

為什麼引入標準差?

因為在實踐中,我們發現相當多的資料都呈現近似於「正態分佈」。在正態分佈圖中,均值可以告訴我們中間的峰值是多少,而標準差則決定了寬度。

反過來正態分佈也可以用來解釋標準差:在乙個標準正態分佈中,數字出現的概率是固定的。

在方差和標準差之間如何選擇?

方差只是計算標準差過程中產生的乙個中間值,但是大多數情況下並不需要此中間值,而是採用了標準差,原因如下:

(1)表示離散程度的數字與樣本資料點的數量級一致,更適合對資料樣本形成感性認知。依然以上述10個點的cpu使用率資料為例,其方差約為41,而標準差則為6.4;兩者相比較,標準差更適合人理解。

(2)表示離散程度的數字單位與樣本資料的單位一致,更方便做後續的分析運算。

(3)在樣本資料大致符合正態分佈的情況下,標準差具有方便估算的特性:66.7%的資料點落在平均值前後1個標準差的範圍內、95%的資料點落在平均值前後2個標準差的範圍內,而99%的資料點將會落在平均值前後3個標準差的範圍內。

概率論09 期望

描述量 描述隨機變數最完備的方法是寫出該隨機變數的概率分布。然而,正如我們在前面章節看到的,概率分布的表達往往都比較複雜,資訊量很大。這如同我們購置汽車的時候,一輛汽車的全面資料可以說是海量的,比如汽車尺寸,油箱大小等等。我們選擇一輛汽車時,往往只使用有限的幾個具有代表性的量來代表汽車的主要特徵,比...

hdu 5570 期望 概率詳解

題目 num j 表示 顏色為 j 的球的個數,題目要求 sum num j 2 0 j m b i j 表示 i 球顏色為 j 的概率。不同球的顏色是互不影響的,所以直接相加就是 個數 所以 num j sum b i j b 1 j b 2 j b n j 0 i n 然後求 num j 2 如...

HDU 3853 期望概率DP

期望概率dp簡單題 從 1,1 點走到 r,c 點,每走一步的代價為2 給出每乙個點走相鄰位置的概率,共3中方向,不動 x,y x y p x y 0 右移 x y x y 1 p x y 1 左移 x y x 1 y p x y 2 問最後走到 r,c 的期望 dp i j 為從 i j 點走到 ...