貝葉斯演算法

貝葉斯演算法：

在大學的時候我們都學過貝葉斯公式：

p(b | a) = p(ab) / p(a) = p(a | b)p(b) / p(a)

表明了，在已知a，b共同發生的概率以及事件a發生的概率, 則可以知道在事件a發生的情況下發生事件b的概率。

然後現在我們就可以將這個公式進行應用到工業中去，假設我們現在有很多的訓練資料，這個時候訓練資料裡面有a、b兩個事件將要發生，而a、b分別由各種特徵所構成。這個時候我們可以算出來在a事件中每個特徵發生的概率，以及在b事件中每個特徵所發生的的概率，例如在a事件中特徵v所佔的概率計算公式：在構成能發生a的事件的所有資料s中特徵v的個數佔s的資料的概率，p_v = v_nums / s_nums。在整個訓練資料中，我們可以求出來p(a) = a_nums / all_nums。其中all_nums表示所有資料的數量，a_nums，表示事件a所佔的數量. (1)

當我們算出來了每個事件中，特徵所佔的比例，這個時候來個資料t由各種特徵所構成，這個時候求這個資料t屬於哪個事件，可以通過公式：

p( (a or b) | t) = p((a or b)t) / p(t) = p(t | (a or b) ) *p((a or b)) / p(t)

這個時候要判斷資料是a or b，因為分母p(t)是一樣的，所以我們只需要求解到分子的大小，哪個概率大則是哪個。

這個時候就用到了樸素這個概念了，因為資料是由各種特徵所構成的，所以樸素貝葉斯假設每個特徵之間是相互獨立的，所以由概率公式知道：

若a,b兩個事件相互獨立，則p(ab) = p(a) * p(b)

其中：（1）就是需要訓練的部分，算出來三個值，分別為：在事件a中每個特徵的概率，在事件b中每個特徵的概率，以及事件a所發生的概率。

（2）就是**的部分，其中運用到了樸素的概念，假設每個特徵之間是相互獨立的。

貝葉斯演算法

貝葉斯演算法

貝葉斯演算法

貝葉斯演算法

相關推薦