KNN學習筆記

2021-08-19 11:07:53 字數 1109 閱讀 7594

knn演算法

有監督學習演算法:現有一組資料來源,含多個特徵值,每個特徵值的樣本對應乙個標籤。

現在輸入一組特徵值,需要得到**值。

在資料來源中尋找k個距離最近的資料,進行分類。

import pandas as pd

import matplotlib.pyplot as plt

from sklearn.neighbors import kneighborsregressor

# 讀取資料

data = np.read_csv('./listing.csv')

features= ['accommodates','bedrooms','bathrooms','beds','price','minimum_nights','maximum_nights','number_of_reviews']

selected_data = data[features]

# 訓練集合

train_set = selected_data[:2000]

# 測試集合

text_set = selected_data[2000:]

knn = kneighborsregressor()

# 開始訓練

knn.fit(train_set[features],train_set['price']) # 輸入樣本與標籤訓練模型,擬合乙個函式

predict = knn.predict(test_set[features]) # 輸入特徵向量,求測試集與樣本集的歐氏距離,找出k個最近的進行'price'**

# 畫出對比圖

過程,讀取資料,選取部分特徵,將資料分為訓練集合合測試集合,使用knn訓練並用測試集合特徵值去**,得到一組**的資料。

KNN學習筆記

knn學習 k nearest neighbors,knn 是一種統計分類器,屬於惰性學習,對包容型資料的特徵變數篩選尤其有效。1.基本原理 輸入沒有標籤即未經分類的新資料,首先提取新資料的特徵並與測試集中的每乙個資料特徵進行比較 然後從樣本中提取k個最鄰近 最相似 資料特徵的分類標籤,統計這k個最...

KNN學習筆記

概述 k最近鄰 k nearest neighbor,knn 分類演算法可以說是最簡單的機器學習演算法了。它採用測量不同特徵值之間的距離方法進行分類。它的思想很簡單 如果乙個樣本在特徵空間中的k個最相似 即特徵空間中最鄰近 的樣本中的大多數屬於某乙個類別,則該樣本也屬於這個類別。演算法總結 k 鄰近...

機器學習實戰《學習筆記》 KNN

新增編碼方式 coding utf 8 from numpy import import operator 準備資料 defcreatedataset group array 1.0,1.1 1.0,1.0 0,0 0,0.1 labels a a b b return group,labels 使...