機器學習 KNN鄰近演算法

1、knn 演算法概述

cover和hart在2023年提出了最初的鄰近演算法。所謂k最近鄰，就是k個最近的鄰居的意思，說的是每個樣本都可以用它最接近的k個鄰居來代表。knn是一種分類(classification)演算法，它輸入基於例項的學習（instance-based learning），屬於懶惰學習（lazy learning）即knn沒有顯式的學習過程，也就是說沒有訓練階段，資料集事先已有了分類和特徵值，待收到新樣本後直接進行處理。knn是通過測量不同特徵值之間的距離進行分類。

knn演算法的思路是：如果乙個樣本在特徵空間中的k個最鄰近的樣本中的大多數屬於某乙個類別，則該樣本也劃分為這個類別。knn演算法中，所選擇的鄰居都是已經正確分類的物件。該方法在定類決策上只依據最鄰近的乙個或者幾個樣本的類別來決定待分樣本所屬的類別。

knn三要素：距離度量、k值的選擇和分類決策規則。常用的距離度量是歐式距離及更一般的lp距離。k值小時，knn模型更複雜；k值大時，knn模型更簡單。k值的選擇反應了對近似誤差和估計誤差之間的權衡，通常由交叉驗證選擇最優的k。常見的分類決策規則是多數表決，對應於經驗風險最小化。

2、knn演算法實現步驟

1）計算測試資料與各個訓練資料之間的距離；

2）按照距離的遞增關係進行排序；

3）選取距離最小的k個點

4）確定前k個點所在類別的出現頻率

5）返回前k個點**現頻率最高的類別作為測試資料的**分類

3、knn演算法中k值的選擇（交叉驗證）

機器學習 KNN鄰近演算法

機器學習鄰近演算法（KNN）

機器學習 K 鄰近演算法 KNN

機器學習 k鄰近演算法 KNN

機器學習 KNN鄰近演算法

機器學習鄰近演算法（KNN）

機器學習 K 鄰近演算法 KNN

機器學習 k鄰近演算法 KNN

相關推薦