svm學後理解

2021-09-02 13:23:14 字數 420 閱讀 7310

隨著oec專案4版本的開發,學習svm演算法也有段時間了,對於其理解做些總結。

首先svm是有監督的分類回歸演算法,對於自動識別分類效果比較好,具體流程如下:

1.對語料每個分類打標籤,並對每個分類下面的txt文字進行分詞。分詞器有好多種,自己可以選擇適合自己的,我用過mmseg4j,ansj和中科院三種分詞器,其中ansj對詞的標註和自動學習詞性方面最好。

2.去停用詞。

3.根據你想用的提取特徵向量的演算法來做不同的操作。

如果用卡方來做向量提取,要計算著個詞在本類出現次數,在其他類出現次數,在本類不在其他類出現次數等

如果用tfidf來做向量提取,要計算詞頻,詞在本類出現的次數,反詞頻,詞在其他類出現的次數等

4.生成模型

5.測試預料進入,分詞,統計詞頻,去停用詞

6.按不同演算法計算相似度

SVM幾點理解

以下內容是我在學習完 統計學習方法 及查閱相關資料後,對svm的一些疑惑的理解,可能還有理解不到位的地方,如有不對,請及時指出。樣本線性可分 硬間隔最大化 樣本近似線性可分 軟間隔最大化 樣本線性不可分 核函式 軟間隔最大化 1 硬間隔最大化時,解是唯一的,即分離超平面wx b 0中w和b是唯一的。...

SVM演算法的理解

距離上次看svm演算法已經快過了半個月了,今天再次看到,溫故知新後決定把自己的理解寫出來。不過由於本人文筆不佳,所以想到什麼寫什麼,等有空了再整理。看到覺得混亂的還請見諒。剛剛看svm的時候,只能明白支援向量機之所以叫支援向量機是因為支援向量,後面懂得了w的內容是什麼 幾何距離的意義 低維對映到高維...

svm的簡單理解

svm是一種訓練機器學習的演算法,可以用於解決分類和回歸問題,同時還使用了一種稱之為kernel trick的技術進行資料的轉換,然後再根據這些轉換資訊,在可能的輸出之中找到乙個最優的邊界。簡單來說,就是做一些非常複雜的資料轉換工作,然後根據預定義的標籤或者輸出進而計算出如何分離使用者的資料。簡單理...