聚類演算法 什麼是聚類

2021-09-29 17:58:59 字數 745 閱讀 7791

聚類分析或聚類演算法就是通過一些方法或手段使資料集集聚成不同的類別,或者叫:簇。簇內部每乙個單位都是相似的。簇與簇之間都是不相似的。

但是聚類其實是一種思想,它不是一種具體的方法。這裡千萬不要搞混。但是可以實現聚類的演算法有很多種。我們通常就使用這些演算法來實現聚類的。比如 k-means就是最為經典的聚類演算法。

在接下來的文章裡我會分享部分經典的聚類演算法。

聚類是把相似的資料分成不同的組(相似或距離或其他),我們不關心組的型別。我們只需要將資料分組,並確保組之間盡可能地不相關。因此聚類不需要合適的資料和學習。這是一種無監督的學習。

分類是一種學習模型,我們需要為它提供訓練資料來學習如何分類,所以分類是有監督的學習。

對比項分類

聚類基礎

將資料分類為眾多已定義的確定類之一

此函式將資料對映到多個集群中的乙個集群,其中資料項的排列依賴於它們之間的相似性。

型別監督學習

非監督學習

訓練集需要

不需要

上面講過,聚類是乙個思想。能實現他的演算法有很多。大致熱門的有下面這些。下圖是自己話的,由於自己才寫完英文版的部落格,所以就不重新畫乙個翻譯了。望大家見諒。

在這裡,相信大家也明白。聚類就是將資料集聚成不一樣的簇。它屬於無監督學習。實現它的方式有很多。接下來的文章裡,我會分享我對聚類演算法的學習。

點我閱讀更多演算法分享

聚類演算法 近鄰聚類演算法

time is always too short for those who need it,but for those who love,it lasts forever.dracula untold 近鄰聚類法同樣是一種基於距離閾值的聚類演算法。coding utf 8 近鄰聚類演算法的pyth...

聚類演算法 層次聚類演算法

層次聚類演算法 hierarchical clustering method 又稱為系統聚類法 分級聚類法。層次聚類演算法又分為兩種形式 凝聚層次聚類 首先將每個物件作為乙個簇,然後合併這些原子簇為越來越大的簇,直到某個終結條件被滿足。層次聚類 首先將所有物件置於乙個簇中,然後逐漸細分為越來越小的簇...

聚類和EM演算法 密度聚類

模型原型 class sklearn.cluster.dbscan eps 0.5,min samples 5,metric euclidean algorithm auto leaf size 30,p none,random state none 引數 eps 引數,用於確定鄰域大小 min s...