貝葉斯 01 初識貝葉斯

==分割線==分割線==分割線==分割線==分割線==分割線==分割線==分割線==分割線==分割線==分割線==分割線==分割線

最先知道貝葉斯公式還是四年前的概率論和數理統計課上，時間也很久了，具體內容早已經忘記，不過畢竟曾經學過，重新看過還是得心應手的。大概用兩三篇的內容來介紹一下貝葉斯，以及機器學習中很重要的一部分"樸素貝葉斯"。首先需要回顧幾個基礎知識。

相信工科的大部分學生都知道這個，條件概率公式，簡單來說就是指事件a在另乙個事件b發生了的條件下發生的概率。用數學表達就是p(a | b),讀作「在b條件下a發生的概率」，最簡單的模型就是p(a | b) = p( ab ) / p( b )。來看一下文氏圖。

圖中可以看出來當b發生後a再發生的概率可以表示為p( a ∩ b ) / p( b ) ,這樣根據定義p(a | b) =

p( a

∩ b ) / p( b )

==》p( a ∩ b ) =

p(a | b)

p( b )

從圖中可知 p( a

∩ b ) = p(b | a) p( a )

==》p(a | b)

p( b ) = p(b | a) p( a )

==》p(a | b) =

p(b | a) p( a ) /

p( b )

這個就是條件概率公式的乙個重要性質，這個公式的模樣已經有點像貝葉斯了，輪廓比較像，再需要點什麼就好了，需要的就是全概率公式。

表示式：

首先要理解乙個概念，那就是「完備事件組」：

設s為試驗e的樣本空間，b1，b2，…，bn為e的一組事件。若：

(1) bi ∩ bj=∅ （i≠j且i、j=1，2，…，n）；

(2) b1∪b2∪…∪bn=s；

則稱b1，b2，…，bn為樣本空間s的乙個完備事件組。

那麼全概率的那個公式又是什麼意思呢，它與完備事件組的關係是什麼呢，來張文氏圖，看圖直觀啊！

看圖讀定義，樣本空間s，圖中對應黑色框內的空間區域；n個互斥的b事件，且所有的b事件的並集又是整個空間s，這一組事件就是實驗e，簡單來說就是「不重複，不遺漏」的事件組就叫做完備事件組。那麼圖中的紅色圓圈內的空間區域，就是全概率公式中的事件a了，可以看出來a在不同的事件bi ( i = 1，2，…，n ) 中的佔比是不同的，這就說明每個子集的發生對a的發生產生不同程度的影響。

那麼這有什麼用呢，其實全概率公式的存在意義就是，當事件a發生的概率無法或者不易直接求得的時候，我們可以求得每個事件b中a發生的概率，然後相加得到a發生的概率，這一切都必須建立在bi ( i =

1，2，…，n

) 是一組完備事件組的基礎上。可以有兩種理解方式：

（1）p(a) = p(ab1) + p(ab2) +p(ab3) + .......+ p(abn) = p( b1 )p( a | b1 ) + p( b2 )p( a | b2 ) + p( b3 )p( a | b3 ) + ..... +

p( bn)p( a | bn )

（2）也可以直接通過（一）介紹的條件概率事件來理解，可以把每乙個bi( i = 1，2，…，n )事件都看作是與a事件相交，求bi發生條件下，a發生的概率，然後對於整個空間s來說，a發生的概率就是這樣n各條件概率的和。

終於說到貝葉斯了，貝葉斯其實是知道結果問原因的乙個東西，這樣就與全概率的想法正好顛倒，就是在紅圈內代表的a事件發生了的條件下，事件組中某乙個事件bi( i = 1，2，…，n )發生的概率，這句話看起來是不是特別像條件概率的情況，沒錯，把這句話帶入到條件概率的求法公式中，就是貝葉斯公示了：

看條件概率公式：p(所求概率事件 | 條件) = p(條件|所求概率事件)*p(所求概率事件)/p(條件)

對應著這個公式我們來看一下：

p(條件)：a事件發生的條件下，根據全概率 ==》p( a ) = p( b1 )p( a | b1 ) + p( b2 )p( a | b2 ) + p( b3 )p( a | b3 ) + ..... + p( bn)p( a | bn )；

p(所求概率事件）：bi發生的概率 ==》p( bi );

==》 p(條件|所求概率事件):p( a | bi );

==》 p(所求概率事件 | 條件):p( bi | a );

好了，貝葉斯公式可以寫出來了吧：

貝葉斯 01 初識貝葉斯

貝葉斯 02 理解貝葉斯

貝葉斯公式

貝葉斯雜記

貝葉斯 01 初識貝葉斯

貝葉斯 02 理解貝葉斯

貝葉斯公式

貝葉斯雜記

相關推薦