02獲取資料集並處理(iris)

2022-08-02 03:36:13 字數 946 閱讀 2925

獲取資料-iris,劃分訓練集和測試集

from sklearn.datasets import

load_iris

#1.獲取資料集(iris)

iris =load_iris()

#print("iris資料集內容:", iris) # data,target,target_name

print("

訓練資料集形狀:

", iris.data.shape)

print("

目標值形狀:

", iris.target.shape)

print("

目標值名稱:

", iris.target_names)

#2.資料集劃分

from sklearn.model_selection import train_test_split #

test_size,train_size,random_stat

x_train, x_test, y_train, y_test = train_test_split(iris.data, iris.target,test_size=0.25)

print("

訓練集x-y:

", x_train.shape, y_train.shape)

print("

測試集x-y:

", x_test.shape, y_test.shape)

執行結果:

訓練資料集形狀: (150, 4)

目標值形狀: (150,)

目標值名稱: [

'setosa''

versicolor''

virginica']

訓練集x-y: (112, 4) (112,)

測試集x-y: (38, 4) (38,)

js獲取並處理php陣列

music array music tayler array music walker array music tayler ours music tayler style music tayler red music walker all fall down music walker faded ...

機器學習iris資料集匯入

iris資料集在模式識別研究領域應該是最知名的資料集了,有很多文章都用到這個資料集。這個資料集裡一共包括150行記錄,其中前四列為花萼長度,花萼寬度,花瓣長度,花瓣寬度等4個用於識別鳶尾花的屬性,第5列為鳶尾花的類別 包括setosa,versicolour,virginica三類 也即通過判定花萼...

用TensorFlow實現iris資料集線性回歸

本文將遍歷批量資料點並讓tensorflow更新斜率和y截距。這次將使用scikit learn的內建iris資料集。特別地,我們將用資料點 x值代表花瓣寬度,y值代表花瓣長度 找到最優直線。選擇這兩種特徵是因為它們具有線性關係,在後續結果中將會看到。本文將使用l2正則損失函式。用tensorflo...