資料探勘演算法的分類

2021-07-09 15:14:09 字數 534 閱讀 3616

演算法是資料探勘模型建立的核心,由於資料探勘是乙個交叉學科,因此其演算法也集大成於一身,豐富多彩。

可根據演算法分析資料的方式、演算法來自的學科、演算法所得結果的型別、學習過程的型別等,對資料探勘的演算法進行分類。

一方面,資料探勘能夠通過olap分析和統計分析,實現對資料的多維度彙總,驗證人們實現對資料所含資訊的假設,實現驗證驅動型資料分析;另一方面,資料探勘也能夠通過資料機器學習和視覺化等,掘取出隱含在資料中的人們事先並不知道的規律,實現發現驅動型資料分析。

根據演算法分析資料的方式,可將資料探勘演算法劃分為假設檢驗型演算法和知識發現型演算法

機器學習演算法較多地集中在模型搜尋和引數優化方面。以引數優化為例,機器學習通常將損失函式看成誤差與多維引數空間的曲面。經典學習就是不斷在資料中尋找規律,反覆調整和優化引數

w,使誤差函式沿著曲面快速到達全域性最小區域或區域性最小區域的過程。

經典統計學方法更加強調模型的先期假設和後期驗證,更加關注不同問題,應採取怎樣的模型形式,怎樣的損失函式和誤差函式以更好的滿足分析目標和資料型別的要求。

資料探勘分類演算法的比較

資料探勘新手常問的乙個問題是,這麼多演算法裡面該選用哪乙個?在沒有更多背景資訊給出時,如果追求 的準確程度,一般用支援向量機 svm 如果要求模型可以解釋,一般用決策樹。使用svm的時候選擇高斯核 即rbf kernel 同時要用交叉驗證 cross validation 選擇合適的模型引數。下面的...

資料探勘分類演算法(2)

精品導航 http www.nitaomei.com 1 資料探勘概述 隨著資料庫技術的迅速發展,資料存量大量增加著,但是挖掘海量資料的背後隱藏著的知識的手段遠遠不足。從而導致了 資料 但知識貧乏 的現象。計算機技術的另一領域人工智慧 artificial intelligence 自1956 年誕...

資料探勘之分類演算法

分類是資料探勘 機器學習和模式識別中乙個重要的研究領域。單一的分類方法主要包括 決策樹 貝葉斯 人工神經網路 k 近鄰 支援向量機和基於關聯規則的分類等 還有用於單一分類方法的整合學習演算法,如bagging和boosting等。1 決策樹 主要用於分類和 的技術之一,是以例項為基礎的歸納學習演算法...