Python機器學習基礎教程學習筆記(一)

2021-10-22 20:11:59 字數 2588 閱讀 3084

演算法:k近鄰法

型別:分類問題

#獲取鳶尾花資料集

from sklearn.datasets import load_iris

iris=load_iris(

)

#列印資料集

print

(iris)

#資料集描述

print

(iris.descr)

#資料特徵

print

(iris[

'data'])

print

(iris[

'data'

].shape)

#特徵說明

print

("target names:{}"

.format

(iris_dataset[

'feature_naems'])

)#資料標籤

print

(iris[

'target'])

print

(iris[

'target'

].shape)

#標籤說明

print

("target names:{}"

.format

(iris_dataset[

'target_names'])

)

#鳶尾花資料集劃分

#from sklearn.model_selection import train_test_split

x_train,x_test,y_train,y_test=train_test_split(iris_dataset[

'data'

],iris_dataset[

'target'

],random_state=0)

print

("x_tarin shape:{}"

.format

(x_train.shape)

)print

("y_tarin shape:{}"

.format

(y_train.shape)

)print

("x_test shape:{}"

.format

(x_test.shape)

)print

("y_test shape:{}"

.format

(y_test.shape)

)

train_test_split(*arrays, **options)使用方法:

參照此文

import pandas as pd

import numpy as np

#驗證資料集可否劃分

iris_dataframe=pd.dataframe(x_train,columns=iris_dataset.feature_names)

grr=pd.plotting.scatter_matrix(iris_dataframe,c=y_train,figsize=(15

,15),marker=

'o',hist_kwds=

,s=60

,alpha=

.8,cmap=mglearn.cm3)

dataframe使用方法:

參照此文

```python

#構建模型:k近鄰演算法

from sklearn.neighbors import kneighborsclassifier

knn=kneighborsclassifier(n_neighbors=1)

knn.fit(x_train,y_train)

#輸入資料

x_new=np.array([[

5,2.9,1,

0.2]])

print

("x_new.shape:{}"

.format

(x_new.shape)

)

#新資料**

prediction=knn.predict(x_new)

print

("prediction:{}"

.format

(prediction)

)print

("prediction target name:{}"

.format

(iris_dataset[

'target_names'

][prediction]

))

#測試集**

y_pred=knn.predict(x_test)

print

("test set prediction:\n{}"

.format

(y_pred)

)print

("test set score:"

.format

(np.mean(y_pred==y_test)

))

Python機器學習基礎教程

本書是機器學習入門書,以python語言介紹。主要內容包括 機器學習的基本概念及其應用 實踐中最常用的機器學習演算法以及這些演算法的優缺點 在機器學習中待處理資料的呈現方式的重要性,以及應重點關注資料的哪些方面 模型評估和調參的高階方法,重點講解交叉驗證和網格搜尋 管道的概念 如何將前面各章的方法應...

《Python機器學習基礎教程》學習筆記 2

第2章 監督學習 利用graphviz開啟繪製的dot格式決策圖出錯,有兩個坑需注意 1 pip install graphviz庫還不夠,還要安裝graphviz軟體,位址 2 強烈建議安裝位址為c盤,安裝後新增軟體所在資料夾 bin 位址到path環境。之前安裝到其他盤,執行一直出錯,make ...

1 python機器學習基礎教程 簡述

一 引言 機器學習 machine learning 從資料中提取知識。分為 監督學習 supervised learning 和無監督學習 unsupervised learning 二 監督機器學習應用 2 基於醫學影像判斷腫瘤是否為良性。3 檢測信用卡交易中的詐騙行為。三 無監督機器學習應用 ...