最近鄰與K近鄰演算法思想

2022-09-05 02:27:11 字數 623 閱讀 6627

在關於徑向基神經網路的一篇博文機器學習之徑向基神經網路(rbf

nn)中已經對最近鄰思想進行過描述,但是寫到了rbf中有些重點不夠突出,所以,這裡重新對最近鄰和k近鄰的基本思想進行介紹,簡潔扼要的加以總結。

最近鄰的基本思想

儲存所有觀察到的有標籤的樣本,然後對新來的測試樣本,在標籤樣本集中找到與測試樣本最接近的標籤樣本,然後將該標籤樣本作為測試樣本的輸出。這是一種典型的監督式學習。在機器學習中有著非常重要的應用。只是對於最近鄰來講,訓練似乎變了含義,它幾乎不做訓練,僅僅是儲存觀測過的樣本及標籤,並沒有學到什麼hypothesis。所以算作是非常lazy的學習演算法。在訓練時lazy,那麼在測試時就要費勁了,因為它需要計算每個標籤樣本與輸入測試樣本之間的相似度,運算花銷較大。這就體現了磨刀不誤砍柴工中磨刀和不磨刀的區別:如果磨刀了,在砍柴的時候就省事兒了,如果不磨刀,在砍柴的時候就得費勁了。

稍微拓展一下,我們選出最相似的k個鄰居,然後由著k個鄰居進行投票,或者線性融合,然後再輸出,這樣的模型就叫做k最近鄰模型。在實際應用中k近鄰的魯棒性比最近鄰要好許多。實際上將k近鄰的相似度作為投票權重融合起來,這樣的方法與統計分析中的蒙特卡洛方法頗為神似。

***********************************

2015-8-7

K最近鄰演算法

參考 所謂k最近鄰,就是k個最近的鄰居的意思,說的是每個樣本都可以用它最接近的k個鄰居來代表。cover和hart在1968年提出了最初的鄰近演算法。knn是一種分類 classification 演算法,它輸入基於例項的學習 instance based learning 屬於懶惰學習 lazy ...

K最近鄰演算法

一 原理 k最近鄰演算法 k nearest neighbor,knn 是最基本的分類演算法,其基本原理是 從最近的k個鄰居 樣本 中,選擇出現次數最多的類別作為判定類別。k最近鄰演算法可以理解為是乙個分類演算法,常用於標籤的 如性別。實現knn演算法核心的一般思路 相似度計算 計算未知樣本和每個訓...

K最近鄰演算法(介紹)

問題 用k最近鄰演算法建立分類系統 學習特徵抽取 學習回歸,即 數值 學習k最近鄰演算法的應用案例和侷限性k最近鄰 k nearest neighbours,knn 演算法 k最近鄰演算法是指在乙個座標系中 前提是把元素放入座標系 so,問題來了,怎麼把他們放入座標系?他們在座標系的位置怎麼確定?其...