機器學習常見的分類演算法的優缺點

2022-07-04 06:00:07 字數 1272 閱讀 4995

在機器學習中,種類最多的一類演算法要屬很類演算法,本文對機器學習中的各種分類演算法的優缺點做乙個總結。

所需估計的引數少,對於缺失資料不敏感

有著堅實的數學基礎,以及穩定的分類效率。

假設屬性之間相互獨立,這往往並不成立。(喜歡吃番茄、雞蛋,卻不喜歡吃番茄炒蛋)。

需要知道先驗概率。

分類決策存在錯誤率。

不需要任何領域知識或引數假設。

適合高維資料。

簡單易於理解。

短時間內處理大量資料,得到可行且效果較好的結果。

能夠同時處理資料型和常規性屬性。

對於各類別樣本數量不一致資料,資訊增益偏向於那些具有更多數值的特徵。

易於過擬合。

忽略屬性之間的相關性。

可以解決小樣本下機器學習的問題。

提高泛化效能

可以解決高維、非線性問題。超高維文字分類仍受歡迎。

避免神經網路結構選擇和區域性極小的問題。

對缺失資料敏感。

記憶體消耗大,難以解釋。

執行和調差略煩人。

思想簡單,理論成熟,既可以用來做分類也可以用來做回歸。

可用於非線性分類。

訓練時間複雜度為o(n)。

準確度高,對資料沒有假設,對outlier不敏感。

計算量太大。

對於樣本分類不均衡的問題,會產生誤判。

需要大量的記憶體。

輸出的可解釋性不強。

運算速度快

簡單易於理解,直接看到各個特徵的權重。

能容易地更新模型吸收新的資料。

如果想要乙個概率框架,動態調整分類閥值。

特徵處理複雜。需要歸一化和較多的特徵工程。

分類準確率高。

並行處理能力強。

分布式儲存和學習能力強

魯棒性較強,不易受雜訊影響。

需要大量引數(網路拓撲、閥值、閾值)。

結果難以解釋。

訓練時間過長。

adaboost是一種有很高精度的分類器。

可以使用各種方法構建子分類器,adaboost演算法提供的是框架。

當使用簡單分類器時,計算出的結果是可以理解的。而且弱分類器構造極其簡單。

簡單,不用做特徵篩選。

不用擔心overfitting。

對outlier比較敏感

常見機器學習演算法優缺點

1 線性模型 形式簡單 易於建模 很好的可解釋性 2 邏輯回歸 無需事先假設資料分布 可得到近似概率 對率函式任意階可導的凸函式,許多數值優化演算法都可直接用於求取最優解 3 線性判別分析 lda 當兩類資料同先驗 滿足高斯分布且協方差相等時,lda可達到最優分類 4 boosting 代表adab...

機器學習中各分類演算法的優缺點比較

文章 1決策樹 decision trees 的優缺點 決策樹的優點 一 決策樹易於理解和解釋.人們在通過解釋後都有能力去理解決策樹所表達的意義。二 對於決策樹,資料的準備往往是簡單或者是不必要的.其他的技術往往要求先把資料一般化,比如去掉多餘的或者空白的屬性。三 能夠同時處理資料型和常規型屬性。其...

機器學習中常見的演算法的優缺點之決策樹

決策樹在機器學習中是乙個十分優秀的演算法,在很多技術中都需要用到決策樹這一演算法,由此可見,決策樹是乙個經典的演算法,在這篇文章中我們給大家介紹決策樹演算法的優缺點,希望這篇文章能夠更好的幫助大家理解決策樹演算法。那麼決策樹自身的優點都有什麼呢,總結下來就是有六點,第一就是決策樹易於理解和解釋,可以...