機器學習入門之sklearn

2021-09-10 06:19:33 字數 762 閱讀 6264

原始碼:

from sklearn.datasets import load_iris

from sklearn.model_selection import train_test_split

def datasets_demo():

'''sklearn資料集使用

:return:

'''# 獲取資料集

iris = load_iris()

print("鳶尾花資料集:\n", iris)

print("檢視資料集描述:\n", iris["descr"])

print("檢視特徵值的名字:\n",iris.feature_names)

print("檢視特徵值:\n", iris.data, iris.data.shape)

print("*" * 30)

# 資料集劃分

x_train, x_test, y_train, y_test = train_test_split(iris.data, iris.target, test_size=0.2, random_state=22)

print("訓練集的特徵值:\n", x_train, x_train.shape)

return none

if __name__ == '__main__':

pass

# **1:sklearn資料集使用

datasets_demo()

這是看完7集以後敲下的

機器學習之Sklearn庫

sklearn庫是在numpy scipy和matplotlib的基礎上開發而成的,因此在介紹sklearn的安裝前,需要先安裝這些依賴庫。numpy是乙個開源的python科學計算庫。scipy庫是sklearn庫的基礎,它是基於numpy的乙個整合了多種數學演算法和函式的python模組。mat...

sklearn機器學習 PCA

pca使用的資訊量衡量指標,就是樣本方差,又稱可解釋性方差,方差越大,特徵所帶的資訊量越多 原理推導 class sklearn decomposition.pca n components none,copy true whiten false svd solver auto tol 0.0,it...

sklearn 機器學習庫

pipeline parameters steps 步驟 列表 list 被連線的 名稱,變換 元組 實現擬合 變換 的列表,按照它們被連線的順序,最後乙個物件是估計器 estimator memory 記憶體引數,instance of sklearn.external.joblib.memory...