K 近鄰演算法

k nearest neighbor演算法又叫knn演算法，這個演算法是機器學習裡面乙個比較經典的演算法，總體來說knn演算法是相對比較容易理解的演算法

根據你的「鄰居」來推斷出你的類別，即如果乙個樣本在特徵空間中的k個最相似(即特徵空間中最鄰近)的樣本中的大多數屬於某乙個類別，則該樣本也屬於這個類別。

.1）計算已知類別資料集中的點與當前點之間的距離

2）按距離遞增次序排序

3）選取與當前點距離最小的k個點

4）統計前k個點所在的類別出現的頻率

5）返回前k個點出現頻率最高的類別作為當前點的**分類

sklearn.neighbors.kneighborsclassifier(n_neighbors=5,algorithm='auto') n_neighbors： int,可選（預設= 5），k_neighbors查詢預設使用的鄰居數 algorithm：快速k近鄰搜尋演算法，預設引數為auto，可以理解為演算法自己決定合適的搜尋演算法。除此之外，使用者也可以自己指定搜尋演算法ball_tree、kd_tree、brute方法進行搜尋， brute是蠻力搜尋，也就是線性掃瞄，當訓練集很大時，計算非常耗時。 kd_tree，構造kd樹儲存資料以便對其進行快速檢索的樹形資料結構，kd樹也就是資料結構中的二叉樹。以中值切分構造的樹，每個結點是乙個超矩形，在維數小於20時效率高。 ball tree是為了克服kd樹高維失效而發明的，其構造過程是以質心c和半徑r分割樣本空間，每個節點是乙個超球體。

K 近鄰演算法

k 近鄰演算法

K 近鄰演算法

K 近鄰演算法

相關推薦