樸素貝葉斯

2021-12-30 05:46:47 字數 593 閱讀 9381

補充該鏈結裡的東西。這篇部落格很完美,我看完這篇部落格,不光懂得了樸素貝葉斯是啥玩意,還懂得了原來說的訓練就是這麼個意思!乙個實際的例子讓我徹底懂了。

就拿鏈結裡的「檢測sns社群中不真實賬號」的例子來解釋這幅圖吧。

確定特徵屬性:找出可以用來區分真實賬號與不真實賬號的特徵屬性。

獲取訓練樣本:就是用人工篩選的精度很高的樣本作為訓練集。

訓練:這裡是通過對訓練集,就是那10000個賬號進行概率的計算,

首先算出真實賬號與不真實賬號發生的概率,就是p(yi)了。然後再算每個屬性在真實賬號和不真實賬號發生的情況下發生的概率,就是那些p(ai|yj)了,算的結果應該是i*j種情況。

到這裡訓練就算完成了吧,然後用訓練出來的這些資料,來套這個公式,

把計算p(xi,yi)這種抽象的計算(計算***賬號是否是真是賬號的概率,沒法直接計算)轉化利用特徵來判斷就可以了(沒有頭像的賬號是真實賬號嗎?沒有好友的賬號是真實賬號嗎,顯然這樣的可以計算概率)。然後那個概率大就把x歸為哪一類。

結束。

樸素貝葉斯

樸素貝葉斯演算法是一種基於概率統計的分類方法,它主要利用貝葉斯公式對樣本事件求概率,通過概率進行分類。以下先對貝葉斯公式做個了解。對於事件a b,若p b 0,則事件a在事件b發生的條件下發生的概率為 p a b p a b p b 將條件概率稍作轉化即可得到貝葉斯公式如下 p a b p b a ...

樸素貝葉斯

1.準備資料 從文字中構建詞向量 2.訓練演算法 從詞向量計算概率 3.測試演算法 儲存為 bayes.py 檔案 參考 coding utf 8 from numpy import 文字轉化為詞向量 def loaddataset postinglist my dog has flea probl...

樸素貝葉斯

機器學習是將資料轉化為決策面的過程 scikit learn縮寫為sklearn 訓練乙個分類器,學習之後 其處理的準確性 def nbaccuracy features train,labels train,features test,labels test from sklearn.bayes ...