3 K均值演算法

2022-07-26 01:06:15 字數 1993 閱讀 7566

作業:

1). 撲克牌手動演練k均值聚類過程:>30張牌,3類

①隨機在撲克牌中抽取30張牌,當中取3張聚類中心10,5,2 進行分

②計算三堆牌的平均值分別為10.5,5.5,2。

③以11,6,2為新的聚類中心來分類

④計算平均值,均值不變,分類結束。

2). *自主編寫k-means演算法 ,以鳶尾花花瓣長度資料做聚類,並用散點圖顯示。(加分題)

3). 用sklearn.cluster.kmeans,鳶尾花花瓣長度資料做聚類,並用散點圖顯示.

from sklearn.datasets import

load_iris

from sklearn.cluster import

kmeans

import

matplotlib.pyplot as plt

iris = load_iris() #

獲取鳶尾花資料集

x = iris.data[:,0] #

獲取鳶尾花花瓣長度資料 :all

x = x.reshape(-1,1) #

將資料轉換為一列資料

#直接呼叫sklearn庫實現對鳶尾花資料進行聚類分析

km_model = kmeans(n_clusters=3) #

構建模型 分成三個類

km_model.fit(x) #

訓練模型 fit(x)指的是x值給km_model進訓練

y = km_model.predict(x) #

**模型

print("

聚類中心:

", km_model.cluster_centers_ ) #

聚類中心,規定函式

print("

**結果:

", y)#畫圖

plt.scatter(x[:, 0], x[:, 0], c=y, s=50, cmap='

rainbow')

plt.show()

4). 鳶尾花完整資料做聚類並用散點圖顯示.

from sklearn.datasets import

load_iris

from sklearn.cluster import

kmeans

import

matplotlib.pyplot as plt

iris = load_iris() #

獲取鳶尾花資料集

x = iris.data #

鳶尾花完整資料

#直接呼叫sklearn庫的kmeans實現對鳶尾花資料進行聚類分析

km_model = kmeans(n_clusters=3) #

構建模型

km_model.fit(x) #

訓練模型

y = km_model.predict(x) #

**模型中每個樣本的聚類索引

print("

聚類中心:

", km_model.cluster_centers_ )

print("

**結果:

", y)#畫圖

plt.scatter(x[:, 2], x[:, 3], c=y, s=50, cmap='

rainbow

') #

x,y,c

plt.show()

5).想想k均值演算法中以用來做什麼?

可以通過k均值演算法。進行機器學習,通過機器學習之後就可以先對樣本進行乙個分析,分析之後就可以進行對其他的**。就是可以通過機器學習之後可以對一些事件的發生進行一些**。

3 K均值演算法

2 自主編寫k means演算法 以鳶尾花花瓣長度資料做聚類,並用散點圖顯示。加分題 1 import numpy as np 2from sklearn.datasets import load iris 3import matplotlib.pyplot as plt 45 iris load ...

3 K均值演算法

1.機器學習的步驟 資料,模型選擇,訓練,測試,2.安裝機器學習庫sklearn pip list 檢視版本 python m pip install upgrade pip pip install u scikit learn pip uninstall sklearn pip uninstall...

3 K均值演算法

4.作業 1 撲克牌手動演練k均值聚類過程 30張牌,3類 第一種劃分 第二種劃分 2 自主編寫k means演算法 以鳶尾花花瓣長度資料做聚類,並用散點圖顯示。加分題 如下 from sklearn.datasets import load iris import numpy as np impo...