最近鄰與K近鄰演算法思想

在關於徑向基神經網路的一篇博文機器學習之徑向基神經網路（rbf

nn）中已經對最近鄰思想進行過描述，但是寫到了rbf中有些重點不夠突出，所以，這裡重新對最近鄰和k近鄰的基本思想進行介紹，簡潔扼要的加以總結。

最近鄰的基本思想

儲存所有觀察到的有標籤的樣本，然後對新來的測試樣本，在標籤樣本集中找到與測試樣本最接近的標籤樣本，然後將該標籤樣本作為測試樣本的輸出。這是一種典型的監督式學習。在機器學習中有著非常重要的應用。只是對於最近鄰來講，訓練似乎變了含義，它幾乎不做訓練，僅僅是儲存觀測過的樣本及標籤，並沒有學到什麼hypothesis。所以算作是非常lazy的學習演算法。在訓練時lazy，那麼在測試時就要費勁了，因為它需要計算每個標籤樣本與輸入測試樣本之間的相似度，運算花銷較大。這就體現了磨刀不誤砍柴工中磨刀和不磨刀的區別：如果磨刀了，在砍柴的時候就省事兒了，如果不磨刀，在砍柴的時候就得費勁了。

稍微拓展一下，我們選出最相似的k個鄰居，然後由著k個鄰居進行投票，或者線性融合，然後再輸出，這樣的模型就叫做k最近鄰模型。在實際應用中k近鄰的魯棒性比最近鄰要好許多。實際上將k近鄰的相似度作為投票權重融合起來，這樣的方法與統計分析中的蒙特卡洛方法頗為神似。

***********************************

2015-8-7

最近鄰與K近鄰演算法思想

K最近鄰演算法

K最近鄰演算法

K最近鄰演算法（介紹）

最近鄰與K近鄰演算法思想

K最近鄰演算法

K最近鄰演算法

K最近鄰演算法（介紹）

相關推薦