演算法:k近鄰法
型別:分類問題
#獲取鳶尾花資料集
from sklearn.datasets import load_iris
iris=load_iris(
)
#列印資料集
print
(iris)
#資料集描述
print
(iris.descr)
#資料特徵
print
(iris[
'data'])
print
(iris[
'data'
].shape)
#特徵說明
print
("target names:{}"
.format
(iris_dataset[
'feature_naems'])
)#資料標籤
print
(iris[
'target'])
print
(iris[
'target'
].shape)
#標籤說明
print
("target names:{}"
.format
(iris_dataset[
'target_names'])
)
#鳶尾花資料集劃分
#from sklearn.model_selection import train_test_split
x_train,x_test,y_train,y_test=train_test_split(iris_dataset[
'data'
],iris_dataset[
'target'
],random_state=0)
print
("x_tarin shape:{}"
.format
(x_train.shape)
)print
("y_tarin shape:{}"
.format
(y_train.shape)
)print
("x_test shape:{}"
.format
(x_test.shape)
)print
("y_test shape:{}"
.format
(y_test.shape)
)
train_test_split(*arrays, **options)使用方法:
參照此文
import pandas as pd
import numpy as np
#驗證資料集可否劃分
iris_dataframe=pd.dataframe(x_train,columns=iris_dataset.feature_names)
grr=pd.plotting.scatter_matrix(iris_dataframe,c=y_train,figsize=(15
,15),marker=
'o',hist_kwds=
,s=60
,alpha=
.8,cmap=mglearn.cm3)
dataframe使用方法:
參照此文
```python
#構建模型:k近鄰演算法
from sklearn.neighbors import kneighborsclassifier
knn=kneighborsclassifier(n_neighbors=1)
knn.fit(x_train,y_train)
#輸入資料
x_new=np.array([[
5,2.9,1,
0.2]])
print
("x_new.shape:{}"
.format
(x_new.shape)
)
#新資料**
prediction=knn.predict(x_new)
print
("prediction:{}"
.format
(prediction)
)print
("prediction target name:{}"
.format
(iris_dataset[
'target_names'
][prediction]
))
#測試集**
y_pred=knn.predict(x_test)
print
("test set prediction:\n{}"
.format
(y_pred)
)print
("test set score:"
.format
(np.mean(y_pred==y_test)
))
Python機器學習基礎教程
本書是機器學習入門書,以python語言介紹。主要內容包括 機器學習的基本概念及其應用 實踐中最常用的機器學習演算法以及這些演算法的優缺點 在機器學習中待處理資料的呈現方式的重要性,以及應重點關注資料的哪些方面 模型評估和調參的高階方法,重點講解交叉驗證和網格搜尋 管道的概念 如何將前面各章的方法應...
《Python機器學習基礎教程》學習筆記 2
第2章 監督學習 利用graphviz開啟繪製的dot格式決策圖出錯,有兩個坑需注意 1 pip install graphviz庫還不夠,還要安裝graphviz軟體,位址 2 強烈建議安裝位址為c盤,安裝後新增軟體所在資料夾 bin 位址到path環境。之前安裝到其他盤,執行一直出錯,make ...
1 python機器學習基礎教程 簡述
一 引言 機器學習 machine learning 從資料中提取知識。分為 監督學習 supervised learning 和無監督學習 unsupervised learning 二 監督機器學習應用 2 基於醫學影像判斷腫瘤是否為良性。3 檢測信用卡交易中的詐騙行為。三 無監督機器學習應用 ...