基於Scikit learn的機器學習模型

2021-09-29 06:10:22 字數 934 閱讀 6347

建立乙個機器學習的模型非常簡單:

form sklearn,liner_model import linearregression # 匯入線性回歸模型

model = linearregression() # 建立線性回歸模型

print(model)

訓練模型,對於監督模型來說為 fit(x,y),對於非監督模型來說為 fit(x)

model.fit()
**新樣本

model.predict(x_new)
**概率,僅針對某些模型有用(如lr)

model.predict_proba(x_new)
計算得分,得分越高,fit效果越好

model.score()
從資料組學到新的「基空間」

model.transform()
將資料按新學到的基進行轉換

model.fit_transform()
scikit-learn本身也提供一些資料組,如鳶尾花資料集

from sklearn import datasets

iris = datasets.load_iris()

print(iris.data.shape

from sklearn import svm

clf = svm.linearsvc()

clf.fit(iris.data, iris.target) #訓練集

clf.predict([[5.0, 3.6,1.3, 0.25]]) # 訓練後輸入新的資料進行**

clf.coef_ #檢視訓練好的模型引數

scikit learn 支援向量機實現手寫體識別

隨時 閱讀筆記 matplotlib inline import matplotlib.pyplot as plt import numpy as np from sklearn import datasets digits datasets.load digits 載入資料 把資料所代表的顯示出來...

scikit learn 筆記之支援向量機

支援向量機是一種經典的分類演算法,其原理是找到一條決策邊界使其距離兩個最近的不同類別的點最遠。對於線性可分的資料集,可以使用線性分類器進行分類,對於線性不可分函式,需要將資料集嘗試通過函式變換對映到高維空間,利用核函式替代內積,求解最優 alpha 隨後求出權重w ww和截距b bb,最終求得決策邊...

分類學習 支援向量機(Scikit learn)

手寫體數字識別 1 手寫體資料讀取 from sklearn.datasets import load digits digits load digits 獲得的手寫體資料儲存在digits變數中 print digits.data.shape 2 資料分割 from sklearn.cross v...