通過KNN例子,實現Sklearn入門

2021-08-20 05:22:36 字數 1251 閱讀 3986

pip 安裝 

安裝 scikit-learn (sklearn) 最簡單的方法就是使用 pip 安裝它.

首先確認自己電腦中有安裝

python (>=2.6 或 >=3.3 版本)

numpy (>=1.6.1)

scipy (>=0.9)

然後開啟cmd視窗,使用如下命令安裝

pip3 install -u scikit-learn(因為我用的版本是python3,所以pip後面要加3)

ps:其實只要電腦中已經安裝anaconda,那就不需要再安裝sklearn了

可以使用conda list 命令檢視anaconda中是否有sklearn模組

import numpy as np       

from sklearn import datasets #從sklearn自帶資料庫中載入鳶尾花資料

from sklearn.model_selection import train_test_split #引入train_test_split函式

from sklearn.neighbors import kneighborsclassifier #引入knn分類器

iris=datasets.load_iris() #將鳶尾花資料存在iris中

iris_x=iris.data #指定訓練資料iris_x

iris_y=iris.target #指定訓練目標iris_y

# print(iris_x[:2,:]) //檢視前兩個例子的所有特徵值

# print(iris_y) //檢視目標標籤名稱

#使用train_test_split()函式將資料集分成用於訓練的data和用於測試的data

x_train,x_test,y_train,y_test=train_test_split(iris_x,iris_y,test_size=0.3)

knn=kneighborsclassifier() #呼叫knn分類器

knn.fit(x_train,y_train) #訓練knn分類器

print(knn.predict(x_test)) #**值

print(y_test) #真實值

輸出結果

一二行實**值,三四行是真實值

用最簡單的資料分類例子實現KNN演算法

k 鄰近演算法 knn 的工作原理是 已知乙個帶標籤的已分類資料集合,輸入未分類的新資料之後,計算新資料到資料集中的每個資料的歐幾里得距離,篩選出前k個最近的點,選擇這k個點 現次數最多的分類,即作為新資料的分類標籤 問題描述 已知4個帶標籤的座標點a1 1.0,1.1 a2 1.0,1.0 b1 ...

SElinux 學習筆記 例子實現

測試環境介紹 作業系統 fedora 22 mate fedora 21 環境搭建 root yum install y policycoreutils python policycoreutils devel selinux policy devel setools hddtemp git vim...

Tempo的PIPA Task的例子實現

pipa是people initiating process activity的意思,也就是流程的初始化節點是人工節點,一般會通過繫結的xform表單來啟動流程。在bpms.intalio.com站點上有乙個非常詳細的pipa的flash demo,並且這個例子演示了表單的繫結,採用的是xform。...