資料探勘回顧一 分類演算法之 kNN 演算法

2021-06-29 12:51:00 字數 439 閱讀 6495

下面用最簡潔的話語說明 knn 演算法:

knn 演算法(k 近鄰演算法)是一種分類演算法,即對於給出的一條待分類的資料或待分類的乙個東西,我們提取出這條資料的特徵值;按照特徵值,通過計算與已經分好類的所有條資料之間的一一歐式距離,把這些所有歐式距離排序,挑選出k個最短的距離;對於這k個最短的距離所對應的已經分好類的k個資料,按類別選出出現次數最多的資料們的類別。那麼,knn演算法就判定,這個類別就是待分類資料或東西的類別。

注意:

1,每一條資料的特徵值一般有多個,不同的特徵值其單位和大小可能不一樣,為了等權重考慮計,計算距離時,一般要每個特徵值進行歸一化數值操作,即每種特徵值的最大值為1。

2, knn演算法的優缺點:

資料探勘 分類演算法 KNN

knn k nearest neighbors k近鄰分類演算法 knn演算法從訓練集中找到和新資料最接近的k條記錄,然後根據他們的主要分類來決定新資料的類別。knn分類演算法是資料探勘分類技術中最簡單的方法之一。所謂k最近鄰,就是k個最近的鄰居的意思,說的是每個樣本都可以用它最接近的k個鄰居來代表...

資料探勘基礎演算法 KNN最近鄰分類演算法

通過計算待 樣本和已知分類號的訓練樣本之間的距離來判斷該樣本屬於某個已知分類號的概率。並選取概率最大的分類號來作為待 樣本的分類號 懶惰分類演算法,其模型的建立直到待 例項進行 時才開始。knn演算法的指導思想是 近朱者赤,近墨者黑 由你的鄰居來推斷出你的類別。本質上,knn演算法就是用距離來衡量樣...

資料探勘系列(5)分類演算法評價

一 引言 分類演算法有很多,不同分類演算法又用很多不同的變種。不同的分類演算法有不同的特定,在不同的資料集上表現的效果也不同,我們需要根據特定的任務進行演算法的選擇,如何選擇分類,如何評價乙個分類演算法的好壞,前面關於決策樹的介紹,我們主要用的正確率 accuracy 來評價分類演算法。正確率確實是...