資料探勘總結之分類與聚類的區別

乙個 classifier會從它得到的訓練集中進行「學習」，從而具備對未知資料進行分類的能力，這種提供訓練資料的過程通常叫做 supervised learning (監督學習)。所謂分類，簡單來說，就是根據文字的特徵或屬性，劃分到已有的類別中。

常用的分類演算法包括：決策樹分類法，樸素的貝葉斯分類演算法(native bayesian classifier)、基於支援向量機(svm)的分類器，神經網路法，k-最近鄰法(k-nearest neighbor，knn)，模糊分類法等。分類作為一種監督學習方法，要求必須事先明確知道各個類別的資訊，並且斷言所有待分類項都有乙個類別與之對應。但是很多時候上述條件得不到滿足，尤其是在處理海量資料的時候，如果通過預處理使得資料滿足分類演算法的要求，則代價非常大，這時候可以考慮使用聚類演算法。

簡單地說就是把相似的東西分到一組，聚類的時候，我們並不關心某一類是什麼，我們需要實現的目標只是把相似的東西聚到一起，因此，乙個聚類演算法通常只需要知道如何計算相似度就可以開始工作了，因此 clustering 通常並不需要使用訓練資料進行學習，這在machine learning中被稱作unsupervised learning (無監督學習)。聚類分析目的在於將相似的事物歸類，同一類中的個體有較大的相似性，不同類的個體差異性很大。

資料探勘總結之分類與聚類的區別

資料探勘常用聚類分類演算法總結

聚類與分類區別

分類與聚類的區別

資料探勘總結之分類與聚類的區別

資料探勘常用聚類 分類演算法總結

聚類與分類區別

分類與聚類的區別

相關推薦

資料探勘常用聚類分類演算法總結