概率論基礎學習筆記

2022-07-15 06:45:11 字數 3219 閱讀 4681

參考: 胡淵明2013國家集訓隊****資訊學競賽中概率論的基礎與應用

初等概率論有三個重要成分, 分別是樣本空間\(\omega\)(我們一般記其每個元素為\(\omega\)), 事件集合\(f\)和概率測度\(p\). 我們常說的事件, 實際上是樣本空間\(\omega\)的某個子集. 所有事件的集合記為\(f\)(所以說\(f\)是集合的集合)實際上我對事件集合的定義還不是很明確. 概率測度\(p\)是事件集合到實數的乙個函式, 乙個合理的概率測度需要滿足以下3條公理:

我們稱符合要求的三元組\((\omega, f, p)\)為概率空間. 典型的例子是: 我們隨機投擲乙個均勻的骰子, 考慮其落地後朝上的面, 則我們有樣本空間\(\omega = \\), 事件集合為\(\omega\)的冪集, 概率測度有\(p(a) = \frac6\).

舉個例子: 現有兩所人數相同的學校, a學校99%是女生, b學校99%是男生. 那麼, 假如我們在兩所學校中隨機抽出一位同學, 那麼這位同學是男生的概率是多少?

50%, 顯而易見.

但是, 假如現在告訴你, 你抽出的這位同學是b學校的, 那麼答案又會變成多少呢?

99%.

由此可見, 當我們得到了更多的資訊後, 事件的概率是會發生改變的.

我們記已知\(b\)事件發生的條件下, \(a\)事件發生的概率為\(p(a | b)\). 比如說, 在上面的例子中, 選出兩所學校的事件分別為\(u_a\)和\(u_b\), 我們令選出的學生分別為男生和女生的事件分別為\(g_m\)和\(g_f\), 則我們有

\[p(g_m) = 50 \% \\ g(g_m | u_b) = 99 \%

\]而我們有如下計算條件概率的公式:

\[p(a | b) = \frac

\]稍作變形得到

\[p(a | b) p(b) = p(ab)

\]這個公式也很常用.

注意上面的\((ab)\)表示\((a \cap b)\), 同時也可以寫作\((a, b)\). 實際上, 在考慮條件概率時, 我們把\(b\)看作了新的樣本空間, 而上述的公式揭示的是兩個樣本空間下概率測度的關係.

我們令\(b_1, b_2, ..., b_n\)為樣本空間\(\omega\)的乙個劃分, 則有

\[p(a) = \sum_^n p(a | b_k) p(b_k)

\]比如說, 考慮上面的例子中的\(50 \%\)是如何得到的:

\[\begin

p(g_m) &= p(g_m | u_a) p(u_a) + p(g_m | u_b) p(u_b) \\

&= 1 \% \times 50 \% + 99 \% \times 50 \% \\

&= 50 \%

\end \]

首先明確定義:

\[函式x: \omega \rightarrow \mathbb \text

\]在多數情況下, 有了隨機變數就可以拋棄對原來樣本空間的關注, 而是關注於對於每個實值, 隨機變數可以取得該值的概率. 從某種意義上說, 這是乙個對樣本空間重新劃分(提到劃分, 是否有想到前面全概率公式中\(b\)的定義?)的過程, 將在這個函式中取得相同值的元素進行了合併.

隨機變數有這樣乙個表達:

\[(x = x) = \

\]對於乙個隨機變數, 其期望為

\[e[x] = \sum_\omega p(\omega) x(\omega) = \sum_x x p(x = x)

\]這樣一來, 對於許多問題我們就不再需要從樣本空間的角度去考慮隨機變數了, 而是直接考慮隨機變數為某個值的事件.

隨機變數的獨立性是指其輸出層面上的獨立性, 對於兩個隨機變數\(x_1\)和\(x_2\), 假如有

\[\forall x_1 \in x_1(\omega), x_2 \in x_2(\omega) \\

p(x_1 = x_1, x_2 = x_2) = p(x_1 = x_1) p(x_2 = x_2)

\]那麼我們就稱\(x_1\)和\(x_2\)是獨立的.

兩個獨立的隨機變數具有乙個重要的性質: 其積的期望等於期望的積.

\[e[\alpha x_1 + \beta x_2] = \alpha e[x_1] \beta e[x_2]

\]這個性質在競賽中十分常用.

給定乙個類似於條件概率的問題: 假如我們知道事件\(a\)一定發生, 那麼樣本空間\(\omega\)上的隨機變數\(x\)會發生什麼變化?

我們記這個受約束的隨機變數為\(x | a\), 那麼對於\(\forall x \in x(\omega)\), 我們有

\[p((x | a) = x) = \frac

\]然後下面的就是大名久仰的全期望公式:

\[e[e[x | y]] = x[x]

\]首先這裡需要明確\(e[x | y]\)的定義: 它相當於乙個新的隨機變數, 其期望表示

\[e[x | y] = \sum_ e[x | y = y] p(y = y)

\]定理的證明如下:

\[\begin

e[e[x|y]] &= \sum_ e[x | y = y] p(y = y) \text \\

&= \sum_ \sum_ x p(x = x | y = y) p(y = y) \text \\

&= \sum_ x \sum_ p(x = x | y = y) p(y = y) \\

&= \sum_ x p(x = x) \text \\

&= e[x]

\end

\]這條公式有什麼用呢? 舉個例子: 考慮在乙個年級中抽取乙個人, 詢問他上次考試的成績, 則這個數值的期望是多少? 我們應該怎樣求?

我們令隨機變數\(x(\omega)\)表示每個人上次考試的分數, 並構造乙個隨機變數\(y(\omega)\)表示每個人所屬於的班級, 則有\(e[x] = e[e[x | y]] = e[x | y = y] p(y = y)\), 其中\(e[x | y = y]\)表示每個班中取乙個人的乘積的期望值. 根據這個公式, 我們只需要算出每個班的平均成績, 再算一次加權平均即可.

到這裡, 要寫的基本上已經寫完了. 但是又有什麼用呢? osu照樣還是不會做, 全期望公式還是不會用... 以後看起來是要找一些概率論相關的書來好好看看了.

edit aug 19, 2017: 這裡的全期望公式還是很容易理解的. 我們不必在意上面的表述形式, 因為其本質和全概率公式是一樣的, 把樣本空間進行劃分後求出每個劃分的期望, 再加權平均得到的結果等於直接求所有樣本的期望的結果. 只不過在期望問題中, 我們通常按照隨機變數得到的值進行劃分, 而不是直接劃分樣本空間, 僅此而已.

概率論基礎

概率論 第一章 隨機事件及其概率 分為兩類 1.確定性現象 2.隨機現象 1.1隨機事件及其運算 1.隨機試驗與樣本空間 隨機試驗具有下列三個特徵 1 試驗可在相同條件下重複進行 2 試驗的結果不止乙個 3 每次實驗之前,不能判定哪乙個結果將會出現 用e表示隨機試驗。試驗e中的每乙個可能結果稱為基本...

概率論筆記

注 本文用 表示並運算,表示交運算,a 表示a的逆事件 樣本空間 乙個試驗中所有可能情況組成的集合 事件的關係與運算 a包含於b a發生 b發生 a並b a與b的和事件 a或b發生 a交b a與b的積事件 ab同時發生 a b a與b的差事件 a發生b不發生 a b互斥 不相容 a交b 空集 a b...

概率論學習

離散型隨機變數的值和概率的分布列表 在很多教材中,這樣的列表都被叫做離散型隨機變數的 概率分布 其實嚴格來說,它應該叫 離散型隨機變數的值分布和值的概率分布列表 這個名字雖然比 概率分布 長了點,但是對於我們這些笨學生來說,肯定好理解了很多。因為這個列表,上面是值,下面是這個取值相應取到的概率,而且...