機器學習中多分類與聚類的區別

2021-09-17 20:41:13 字數 799 閱讀 6265

在機器學習中,常常有人分不清分類和聚類。分類與聚類是機器學習中基礎但卻很重要的概念。下面就讓我們看看分類和聚類的區別吧。

在日常生活中,我們見到西瓜就知道它是一種水果,見到冬瓜便知道它是一種蔬菜。

這是人們硬性規定好的我們已經知道的常識。那麼我們是如何知道的呢?可能是父母

或者老師或者其他人告訴你們這個東西就是這麼叫的。想想我們小時候幾乎每家都有

乙個兒童認知表,上面畫著水果蔬菜各種動物等。有人告訴你事物的分類,並訓練你

認知他們並將它們分類,這就是分類的本質。

在機器學習中,分類是根據一些給定類別的樣本,訓練某種學習機器(即得到某種目標函式),使它能夠對未知類別的樣本進行分類。這屬於supervised learning(監督學習)。

在生活中,有其他人告訴你或規定這個東西是什麼屬於哪一類的,我們才知道它是什

麼屬於哪一類。那麼如果出現了個新東西,或者沒人告訴你,你怎麼才能區分他們

呢?你可能會根據他們的外表,顏色等特徵來區分它們,你根據特徵將相似的東西歸

在一起,這就叫做聚類。

在機器學習中,聚類是機器將一些未知分類的樣本,從中總結出它們個體間相似的部分個體並將相似的個體歸為一類的過程。

分類就是在已知分類有意地訓練機器區分資料屬於哪一類。

聚類就是在未知分類,讓機器自己找出哪些資料相似,並將相似的資料歸為一類。

就像是武俠**中門派**和散修一樣的區別。門派**有師傅告訴如何修煉是正確的,並引導你走向正確的修煉道路。而散修只能自己總結摸索正確的修煉道路。

聚類與分類區別

分類 classification 找出描述並區分資料類或概念的模型 或函式 以便能夠使用模型 類標記未知的物件類。分類分析在資料探勘中是一項比較重要的任務,目前在商業上應用最多。分類的目的是學會乙個分類函式或分類模型 也常常稱作分類器 該模型能把資料庫中的資料項對映到給定類別中的某乙個類中。分類和...

機器學習中分類和聚類的區別

在機器學習中有兩種常見的任務 分類 classification 和聚類 clustering 在初學機器學習時,對這兩個概念的理解容易混淆,隨著學習的深入,對這兩個概念有了基本的認識,現總結如下 1.分類 屬於監督學習的範疇,根據一些給定的已知類別的樣本,使它能夠對未知類別的樣本進行分類,要求必須...

機器學習中分類與聚類的本質區別

機器學習中有兩類的大問題,乙個是分類,乙個是聚類。在我們的生活中,我們常常沒有過多的去區分這兩個概念,覺得聚類就是分類,分類也差不多就是聚類,下面,我們就具體來研究下分類與聚類之間在資料探勘中本質的區別。分類有如下幾種說法,但表達的意思是相同的。分類演算法的侷限 分類作為一種監督學習方法,要求必須事...